Yetenek

Hassas içerik ekranda okunabilir kalır, ekran görüntüsünde okunamaz hale gelir

Sadece görüntüleme yetkisi olan biri ekranın fotoğrafını çektiğinde, görüntü kurumunuzdan piksel olarak çıkar — ve günümüz AI'ları bu piksellerden saniyeler içinde metin çıkarabiliyor. ZeroLeak bu pikselleri öyle düzenler ki, ekranın önündeki kişi içeriği rahatça okur, ama görüntü bir OCR motoruna veya AI görme modeline verildiğinde anlamsız çıktı üretir.

Çoğu kurum kopyala-yapıştır, dosya indirme, e-posta iletme gibi bilinen veri çıkış yollarını zaten kontrol altında tutuyor. Geriye kapatılamayan tek yol kalıyor: ekran görüntüsü. Bir kullanıcının elindeki telefonla çektiği fotoğraf, işletim sisteminin ekran görüntüsü tuşu, ikinci bir cihazla yapılan ekran kaydı — bunların hiçbirini geleneksel veri sızıntı önleme (DLP) araçları görmez. Üstüne, bu çıkan görüntüden bilgi çıkarmak eskisi gibi insan emeği istemiyor: GPT-4V, Claude Vision gibi modeller bir fotoğrafa bakıp tablo, form, sözleşme metnini birkaç saniyede yeniden kuruyor. ZeroLeak bu yolu pikselin kendisinde kapatır.

8 katman
Sunucuda oluşturulan her sayfaya uygulanan piksel düzeyi teknikleri
AI görme modelleri
Döner kare bölütleme özellikle bu modeller için tasarlandı
Sunucuda render
Kullanıcının tarayıcısı HTML, JavaScript veya DOM almaz — sadece piksel akışı alır

Geleneksel DLP'nin kapatamadığı yol: ekran görüntüsü

Her iyi yönetilen kurum bilinen veri çıkış yollarını zaten kontrol ediyor. Kopyala-yapıştır izleniyor, dosya indirme kayıt altında, e-postalar taranıyor, baskı kısıtlanıyor. Bu kontroller kazara veri açığa çıkmasının büyük çoğunluğunu durduruyor.

Geriye, hiçbirinin göremediği tek bir yol kalıyor: ekran görüntüsü. Sadece görüntüleme yetkisi olan bir kullanıcı ekranın fotoğrafını çekiyor — elindeki telefonla, işletim sisteminin ekran görüntüsü kısayoluyla, ya da ayrı bir cihazla yapılan ekran kaydıyla. Görüntü kurumdan piksel olarak çıkıyor. Piksel ne bir kopyala-yapıştır olayı, ne bir dosya indirme, ne bir e-posta — mevcut araçların hiçbiri onu bir veri çıkışı olarak algılamıyor.

Bu görüntüyle yapılabilecekler son birkaç yılda dramatik biçimde değişti. Klasik OCR motorları (Tesseract, AWS Textract gibi) bir görüntüden üretim kalitesinde metin çıkarabiliyor. Modern AI görme modelleri — GPT-4V, Claude Vision, Gemini gibi — daha da ileri gidiyor: görüntüye bütüncül bakıp tablo yapısını, sözleşme bölümlerini, form alanlarını çıkarsıyor, bazen iyi eğitimli bir insandan bile fazlasını okuyor.

Bu sorun için sıkça önerilen savunmalar — görünür filigran, kopyalanamaz DOM, ekran kaydı tespiti, mobil cihaz yönetiminden pano kontrolü — artık geçerliliğini koruyamayan varsayımlara dayanıyor. Görünür bir filigran etrafındaki metnin okunmasını engellemez. Kopyalanamaz DOM cep telefonundaki kamerayı durdurmaz. Ekran kaydı tespiti ayrı bir cihazla yapılan kaydı görmez.

Bu yolu gerçekten kapatan tek yer ekranda gösterilen pikselin kendisidir — kullanıcının ekranında görünen şeyi öyle bir düzenlersiniz ki, çekilen görüntüden anlamlı metin çıkarılamaz hale gelir.

ZeroLeak ekran görüntüsü yolunu nasıl kapatır

ZeroLeak korunan web uygulamasını sunucudaki bir tarayıcıda çalıştırır ve oluşturulan kareler kullanıcıya ulaşmadan önce piksel düzeyinde müdahalelerden geçirir. Kullanıcının tarayıcısı bir piksel akışı alır — HTML, DOM veya JavaScript değil — yani içerik çıkarmanın tek yolu ekrandakini fotoğraflamaktır. O görüntü ise tasarım gereği OCR ve AI görme modelleri için okunamaz haldedir.

Uygulama kullanıcının tarayıcısında değil, ZeroLeak'in içinde çalışır

Korunan web uygulamasını ZeroLeak kendi sunucusunda, başlıksız (headless) bir tarayıcının içinde açar. Kullanıcının tarayıcısı sayfanın HTML'ini, JavaScript'ini veya DOM'unu hiç almaz — sadece o sayfanın görüntülenmiş halinin piksel akışını alır. Bir video izliyormuş gibi düşünebilirsiniz: tıklama ve klavye girdileri arkaya, sunucudaki tarayıcıya geri gönderilir; ondan dönen yeni görüntü kullanıcıya akar.

Sekiz farklı piksel düzeyi değişikliği OCR motorlarını yanıltır

Sunucuda oluşturulan her sayfa kullanıcıya gönderilmeden önce sekiz bağımsız piksel müdahalesinden geçer. Kullanıcının gözünün fark etmeyeceği kadar küçük gürültü, karakter kenarlarına yerleştirilen ince çizgiler, renk kanallarının ayrıştırılması ve benzeri teknikler birlikte uygulanır. Her teknik OCR motorlarının farklı bir aşamasını hedef alır; üst üste konulduklarında bir motorun aştığı katmanı diğeri durdurur.

Günümüz AI görme modellerini özellikle hedefleyen ayrı bir koruma katmanı vardır

GPT-4V, Claude Vision, Gemini gibi modeller bir görüntüye bütüncül bakar — sadece harf harf okumaz, sayfanın düzenini, başlıkları, tabloları çıkarmaya çalışır. Bu yüzden tek başına harf düzeyinde piksel müdahalesi yetmez. ZeroLeak görüntüyü kullanıcının fark edemeyeceği hızda dönen küçük karelere böler ve her kareyi bağımsız bir desenle pikselleştirir. İnsan görsel sistemi dönen kareleri kaynaştırıp sabit ve okunabilir bir görüntü oluşturur; AI görme modeli tek bir kareden bile sabit bir metin veya düzen yakalayamaz.

Forensic filigran ve metin şifreleme korumalarıyla birlikte tek bir politika olarak yapılandırılabilir

Anti-OCR koruması ZeroLeak'in diğer ekran katmanı korumalarıyla aynı yapılandırma içinde çalışır. Sayfa, kırpılsa veya yeniden ölçeklense bile iz bırakacak gizli bir kullanıcı kimliği taşıyabilir (forensic filigran); ve görünen metnin DOM'daki karşılığı kopyalandığında anlamsız çıktı verebilir (metin şifreleme). Her katman korunan servis bazında bağımsız açılıp kapatılır — kullanım senaryosuna göre kombinasyon seçilir.

Her sayfaya uygulanan sekiz farklı piksel müdahalesi

Aşağıdaki sekiz teknik, sunucuda oluşturulan her sayfaya kullanıcıya gönderilmeden önce uygulanır. Her biri OCR motorlarının ve AI görme modellerinin farklı bir zayıf noktasını hedefler. Üst üste konulduklarında, bir saldırganın çekeceği görüntüden metin çıkarmak için aşması gereken yüzey toplamı, tek tekniklerin etkisinden çok daha büyüktür.

İnsan gözünün fark etmeyeceği rastgele piksel gürültüsü

Her piksel çok küçük bir aralıkta rastgele parlaklık değişimine uğrar. İnsan bunu okumayı etkilemeyen hafif bir doku olarak algılar; ancak OCR motorlarının metin kenarlarını ve harf şekillerini ayırt etmek için baktığı temiz, tutarlı piksel sınırları artık orada değildir.

OCR'nin harf kenarlarını aradığı frekans bandına yapılan bozma

Klasik ve modern OCR motorları görüntü içindeki harf kenarlarını ve çizgi kalınlıklarını belirli bir uzamsal frekans bandında arar. Bu band hedeflenerek ince bir frekans bozması uygulanır. Görüntünün genel yapısı insan okuyucu için net görünür, OCR'nin kenar tespit modülü ise güvenilir bir kenar bulamaz.

Aynı harfin kırmızı, yeşil ve mavi kanallarda farklı görünmesi

Metin işleme, renk kanalları arasında küçük farklarla farklı şekilde uygulanır; aynı karakter kırmızı, yeşil ve mavi kanallarda farklı oluşturulur. İnsan gözü üç kanalı kaynaştırıp tek okunabilir karakter görür. Çoğu OCR motoru görüntüyü önce gri tonlamaya çevirir — bu süreçte ihtiyaç duyduğu kanallar arası harf bilgisini kaybeder.

Harflerin sınırlarına yerleştirilen ince çizgi örtüsü

Bir harfin nerede bittiği ve diğerinin nerede başladığı, OCR'nin doğru çalışması için kritik bir aşamadır. Sayfanın görüntüsüne bu harf-arası sınırlara denk gelen, çok ince ve kullanıcıya arka plan dokusu gibi görünen çizgiler eklenir. İnsan göz çizgileri arka plan zannedip atlar; OCR ise iki harfi tek harf ya da bir harfi iki harf olarak ayırır ve metni yanlış parçalar.

Her harfin gözle görülmeyecek miktarda piksel-altı kaydırılması

Her harf, insanın algılayamayacağı kadar küçük — piksel ölçeğinin altında — bir miktar kaydırılır. Okuma deneyimi değişmez. OCR motorlarının harfleri tanımlamak için kullandığı temel çizgi konumu ve gövde hizalaması bozulduğu için tanıma doğruluğu düşer.

Her harfin içinde sınırlı piksel karıştırma

Her harfin kendi alanı içinde sınırlı bir piksel yer değiştirmesi uygulanır. Okuma mesafesinde harf göze aynı görünür. Ancak OCR motorlarının bir harfin 'A' mı 'R' mi olduğunu belirlerken kullandığı piksel düzeyi istatistikler bozulur.

Metnin arka planına yerleştirilen düşük şiddetli müdahale desenleri

Metin olmayan bölgelere, insan gözünün neredeyse hiç fark etmediği özel desenler yerleştirilir. Bu desenler OCR'nin önce metin bölgelerini bulup sonra okuma yaptığı aşamayı yanıltır — metin ile arka plan arasındaki kontrast OCR'nin algısında düşer, motor metnin nerede başladığını belirleyemez.

OCR ve AI modellerinin kendi iç yapısı hedeflenerek hesaplanan müdahale

Temsili bir OCR veya AI görme modeli alınıp, o modelin kendi iç çalışma yapısı (gradient) üzerinden hesaplanan piksel değişiklikleri uygulanır. Sonuç, aynı aileden başka modellere de etki eder. Üstteki yedi tekniğin üzerine eklendiğinde, toplam etki tek tekniklerin toplamından daha fazladır.

Modern AI görme modelleri için ayrı bir katman — döner kare bölütleme

AI görme modelleri (GPT-4V, Claude Vision, Gemini ve benzerleri) bir görüntüye OCR'den farklı bir şekilde bakar. Harf harf okumak yerine sayfaya bütüncül bakıp düzeni, tabloyu, formu yeniden kurmaya çalışırlar. Yukarıdaki sekiz teknik klasik OCR'yi güvenilir şekilde durdurur, ama bu bütüncül okuyucuları tamamen etkisiz hale getirmez. Döner kare bölütleme bu okuyucular için tasarlanmış katmandır.

01

Görüntü küçük karelere bölünür, her kare ayrı bir desenle pikselleştirilir

Sunucuda oluşturulan her görüntü görünmez bir ızgaraya (genellikle 3×3) bölünür. Her kare bağımsız bir pikselleştirme deseni ve bağımsız bir desen evresiyle uygulanır. İki komşu kare arasında ortak bir yapı yoktur.

02

Desenler insanın fark edemeyeceği hızda döner

Pikselleştirme deseni, kareler arasında insan görsel sisteminin algılayabileceğinden hızlı, ama gözün hala kararlı bir görüntü oluşturabileceği bir hızda döner. Kullanıcı sayfayı normal okur. Tek bir kareye veya kısa bir kare dizisine bakan AI görme modeli ise sabit bir metin veya düzen yapısı yakalayamaz.

03

Her kare bağımsızdır — bir kareyi çözmek diğerine yardımcı olmaz

Kareler birbirleriyle desen veya evre paylaşmaz. Bir AI modeli bir karenin pikselleştirme desenini çözse bile, bu bilgiyi komşu karelere uygulayamaz. Görüntünün tamamını çözmek için her kareyi ayrı ayrı çözmek gerekir; bu, kare sayısıyla doğru orantılı bir iş yükü demektir.

04

Sekiz piksel tekniğinin üzerine ek bir katman olarak çalışır

Döner kare bölütleme tek başına çalışan bir savunma değil — yukarıdaki sekiz tekniklik piksel katmanının üzerine eklenir. Bir AI modeli üst katmanı kısmen aşsa bile, altında hala harf düzeyini hedefleyen sekiz tekniklik bir katman vardır. Saldırganın aynı görüntüde iki farklı koruma türünü yenmesi gerekir.

05

Kare sayısı, dönüş hızı ve yoğunluk her korunan servis için ayrı yapılandırılır

Izgara yoğunluğu, dönüş hızı, desen şiddeti ve ızgara geometrisi her korunan web servisi için ayrı belirlenir. Yüksek hassasiyetli içerik için (hukuk dosyaları, mali tablolar) koruma sıkılaştırılır; günlük içerikler için temel ayarlar yeterlidir.

06

Görünür filigran ve DOM tabanlı korumaların kırılabildiği yerde çalışır

Yarı saydam filigranlar ve kopyalanamaz DOM öğeleri kırpılarak veya filtrelenerek aşılabilir — altta hala temiz bir görüntü vardır. Döner kare bölütleme ise içeriğin asıl piksellerini değiştirir, altta gizlenmiş 'temiz' bir görüntü yoktur.

Hangi durumlarda fark yaratır

Klinik personeli için hasta verisi ekranları

Klinik çalışanları görev gereği hasta verilerini ekranda görmek zorundadır ama bu verilerin kurumdan çıkmaması gerekir. ZeroLeak ile veriler oturum içinde okunabilir kalır, çekilen bir ekran görüntüsünden ise anlamlı bilgi çıkarılamaz. Sadece görüntüleme yetkisine sahip roller için HIPAA'nın minimum açıklama prensibiyle uyumludur.

Finansal raporlar, sözleşmeler ve veri odası belgeleri

Okunması gereken ama kimsenin telefonuna sıçraması istenmeyen içerikler — mali tablolar, sözleşme metinleri, due-diligence dosyaları. Anti-OCR ve döner kare bölütleme bir arada uygulandığında, belge ekranda rahatlıkla okunur, çekilen görüntü ise işe yaramaz hale gelir.

Kamu ve istihbarat operasyon konsolları

Analistlerin görmesi gereken ama dışarı çıkmaması gereken sınıflandırılmış içerikler. Piksel düzeyinde değişiklik, ekran görüntüsü yoluyla sızma yolunu erişim politikasıyla aynı sınırda kapatır.

Yüklenici ve üçüncü taraf erişimi

Bir müşteri paneline, denetim arayüzüne veya araştırma konsoluna kısa süreli yetki alan dış kullanıcılar. Kullanıcı içeriği okur; ekran görüntüsü çekse de içeriği başka bir ortama taşıması mümkün olmaz.

Araştırma ve klinik çalışma veri odaları

Araştırmacılar çalışma verilerini, hasta kayıtlarını, laboratuvar sonuçlarını görmek zorundadır. Açıklama sınırı çoğunlukla dışarı taşımayı yasaklar. Anti-OCR bu yasak sınırını politikadan teknik bir kontrole dönüştürür.

AI çağında insider risk programları

Çalışan riski programları, çekilen bir ekran görüntüsünün zararsız olduğunu artık varsayamaz. Cebinde AI bulunan herhangi bir kişi için, ekranda görünen her içerik potansiyel bir dışa aktarım vektörüdür. Anti-OCR ve döner kare bölütleme bu riski, AI öncesi dönemin sadece-insan ortamlarındaki seviyeye geri çeker.

Sık sorulan sorular

Anti-OCR teknikleri insanın okumasını etkiler mi?
Hayır. Her tekniğin müdahale şiddeti, insan görsel sisteminin algılayabileceği eşiğin altında kalacak şekilde ayarlanmıştır. Rastgele gürültü çok küçük, piksel-altı kaydırma insan algı eşiğinin altında, kare bölütleme dönüş hızı gözün titreme kaynaştırma eşiğinin üstünde. Kullanıcı sayfayı normal okur; OCR motorları ve AI görme modelleri ise bozulmuş bir girdi görür.
GPT-4V, Claude Vision, Gemini Pro Vision gibi modellere karşı çalışıyor mu?
Sekiz piksel tekniği klasik OCR motorlarını (Tesseract, AWS Textract, Google Cloud Vision, Azure Computer Vision) güvenilir şekilde durdurur. AI görme modelleri görüntüye bütüncül baktığı için sadece harf düzeyindeki tekniklere daha dirençlidir — bu yüzden döner kare bölütleme ayrı bir katman olarak tasarlandı. Kare bölütleme bu modellerin güvendiği düzen yeniden kurmayı bozar; altta hala sekiz tekniklik piksel katmanı olduğundan, üst katmanı kısmen aşan bir model bile alttakini ayrıca aşmak zorundadır.
Sayfa hala interaktif kalıyor mu — tıklama, kaydırma, form?
Evet. ZeroLeak tarayıcıya piksel akışı yollarken kullanıcı girdilerini geri kabul eder. Fare tıklamaları, klavye girdileri, kaydırma olayları ve form gönderimleri sunucudaki başlıksız tarayıcıya geri akar ve orada korunan uygulamada yürütülür. Kullanıcı deneyimi normal bir tarayıcı sekmesindeki gibidir; değişen tek şey render ve DOM'un nerede yaşadığıdır.
Kararlı bir saldırgan ZeroLeak'in piksel müdahalesine özel bir OCR modeli eğitebilir mi?
Saldırganın bunu yapabilmesi için bozulmuş ve orijinal görüntüleri eşleştiren büyük bir veri seti toplaması gerekir. Müdahale parametreleri zaman içinde değişir, karakter sınır çizgileri TR7'ye özgüdür ve herhangi bir public OCR pipeline'da üretilmez, kare bölütlemenin her kare bağımsızlığı eğitim seti boyutunu sekiz tekniklik katmanın çok üstüne çıkarır. Pratikte böyle bir karşı-model kurmak, korunan servise sürekli erişim ve savunan tarafla benzer bir bütçe ister — kolay aşılır bir eşik değildir.
Kullanıcının form alanlarına yazdığı metin de korunuyor mu?
Evet. Form alanlarının render'ı da sunucudaki tarayıcıda yapılır; kullanıcı alanın pikselleştirilmiş halini görür ve aynı anti-OCR teknikleri uygulanır. Yarı yazılmış bir formun ekran görüntüsünden de anlamlı metin çıkarılamaz.
Bu koruma forensic filigran ve metin şifreleme ile nasıl ilişkili?
Anti-OCR ekran görüntüsünü okunamaz hale getirir. Forensic filigran ekran görüntüsünü izlenebilir hale getirir — kırpma ve yeniden ölçekleme sonrası bile, piksellerin içine gömülü iz kimliği hangi oturumun sızıntı ürettiğini operatöre gösterir. Metin şifreleme ise kopyala-yapıştır yolunu hedefler: DOM'daki metin karakterleri görsel olarak eşdeğer farklı karakterlerle değiştirilir, böylece ekrandaki yazı göze doğru okunur ama kopyalandığında anlamsız çıktı olur. Her katman bağımsızdır; çoğu kurulum üçünü birlikte kullanır.
Performans etkisi nedir?
Piksel müdahaleleri ve kare bölütleme sunucu render pipeline'ı içinde uygulanır. Gecikme maliyeti çok küçüktür — sıradan donanımda kare başına birkaç milisaniye — ve render örnekleri arasında paralellenebilir. Kapasite render altyapısıyla ölçeklenir, kullanıcı sayısıyla doğrudan ilişkili değildir, çünkü iş render'ın zaten yapıldığı yerde yapılır.
Kullanıcının özel bir tarayıcı veya eklenti kurması gerekiyor mu?
Hayır. Kullanıcı herhangi bir standart tarayıcıdan korunan URL'ye bağlanır. Piksel akışı standart web teknolojileriyle iletilir; kullanıcı tarafında yerel istemci, eklenti veya kendine özgü protokol yoktur.

Ekran görüntüsü yoluyla sızıntı yolunu kapatın

ZeroLeak'in anti-OCR piksel katmanını ve döner kare bölütlemesini canlı demoda görün. Aynı sayfayı Tesseract, AWS Textract, GPT-4V ve Claude Vision'a verip diğer uçtan ne çıktığını gösteririz.