Gelen kutunuzda daha akıllı bilgiler ister misiniz? Sadece kurumsal AI, veri ve güvenlik liderleri için önemli olanı elde etmek için haftalık bültenlerimize kaydolun. Şimdi abone olun
Parlak Verilerİsrail net kazıma şirketi Hem Meta hem de Elon Musk’ın X’i yendi Federal mahkemede, Çarşamba günü yapay zeka sistemlerinin gerçek zamanlı net verilerine sınırsız erişim sağlamak için tasarlanmış kapsamlı bir AI altyapı paketini tanıttı-şirketin büyük teknoloji platformlarının tekelleşmeye çalıştığını savunduğu bir yetenek.
Duyurusu Derin arama– Browser.aive gelişmiş veri toplama protokolleri, on yıllık şirket için özel bir net kazıma hizmetinden CEO veya Lenchner’ın “AI şirketleri için benzersiz bir altyapı katmanı” dediği şeye dönüşen dramatik bir genişlemeyi temsil eder. Hareket, yapay zeka şirketleri, sohbet botlarına, otonom ajanlara ve diğer AI uygulamalarına güç vermek için gereken mevcut net bilgilerine erişmek için giderek daha fazla mücadele ediyor.
VentureBeat ile yapılan özel bir röportajda Lenchner, “Bugünün LLM’lerinin zekası artık sınırlayıcı faktörü değil; erişim,” dedi. “Son on yılı genel net verilerine açık erişim için savaşarak geçirdik ve bu yeni teklifler bizi yolculuğumuzun bir sonraki bölümüne getiriyor, biri gerçekten erişilebilir veriler ve daha sonra bağlamsal olarak farkında olan ajanların yükselişi.”
Lansman parlak verilerin izliyor Yüksek profilli yasal zaferler 2024’te, federal hakimler her ikisinden gelen davaları reddettiğinde Meta Ve X Şirketin yasadışı bir şekilde platformlarını kazıdığını iddia etti. Bu kararlar, neyin oluşturduğunu tanımlayan önemli yasal emsal oluşturdu ”genel veriler”İnternette – giriş yapmadan görüntülenebilen ve bu nedenle yasal olarak toplanabilecek ve kullanılabilecek bilgiler.
Mahkeme davaları Meta Ve X olmuştu Parlak Veriler Müşteriler şirkete dava açarken bile, birçok teknoloji devinin net kazımasına yönelik çelişkili duruşları vurguluyor. Kararların, dil modellerini eğitmek ve işletmek için net verilerine büyük ölçüde dayanan AI endüstrisi için daha geniş etkileri vardır.
Lenchner, “Mahkemede her ikisinin de parlak bir veri müşterisi olduğu ortaya çıktı, çünkü herkesin verilere, herkese, özellikle mannequin oluşturanlara ihtiyacı var” dedi. “Finansal kaynaklara sahip tek şirket biziz ve bunu yapma cesaretini bile söyleyebilirim.”
Yargıç William AlsupX davasına başkanlık eden, sosyal medya şirketlerine “herhangi bir temelde veri toplayabileceğini ve kullanabileceğine karar vermeleri için serbest dizgin vermenin“ kamu yararını çözecek bilgi tekelleri ”yaratma riskleri verdiğini yazdı. Karar, oturum açma kimlik bilgileri olmadan görüntülenebilir verilerin yasal olarak kazınabilen kamuya açık bilgileri oluşturduğunu tespit etmiştir.
Parlak veriler daha önce bir X’e karşı sayaçplatformun, Musk’ın AI şirketi Xai’ye fayda sağlamak için bir veri tekeli oluşturmaya çalışarak antitröst yasalarını ihlal ettiğini iddia etti. Ancak, bu dava o zamandan beri çözüldü. Lenchner, “Gizli terimler, parlak veriler, kamu verilerinin halka açık olması gerektiğine dair temel inancından asla geri çekilmemesine rağmen, bu inançla tutarlı olarak, parlak verilerin her zaman sahip olduğu ve müşterilerimizin beklediği endüstri lideri hizmetleri sunmaya devam edeceğini bildirmekten memnuniyet duyuyoruz” dedi.
Deep Lookup ve Browser.ai Hedef AI şirketleri veri erişimi ile mücadele ediyor
Şirketin yeni ürünleri, Lenchner’ın AI sistemleri için üç temel gereksinim olarak tanımladığını ele alıyor: algoritmalar, hesaplama gücü ve veri erişimi. Sırasında Parlak Veriler Yapay zeka algoritmaları geliştirmez veya bilgi işlem kaynakları sağlamaz, üçüncü gereksinim için kesin bir çözüm olmayı amaçlamaktadır.
Derin arama Karmaşık, çok katmanlı iş sorularını gerçek zamanlı olarak cevaplamak için tasarlanmış bir doğal dil araştırma motoru olarak işlev görür. Özet sağlayan genel amaçlı arama motorlarının veya AI Chatbots’un aksine, Deep Lookup, “Hepsini Bul” ile başlayan sorgular için kapsamlı sonuçlar konusunda uzmanlaşmıştır. Örneğin, kullanıcılar “2023’te Panama ve Süveyş Kanallarından geçen tüm nakliye şirketleri yüzde 2’nin üzerinde azalmış” isteyebilirler.
Sistem, şu anda 200 milyardan fazla HTML sayfası içeren ve ayda 15 milyar ekleyen Brilliant Knowledge’nın devasa net arşivinden çekiliyor. Gelecek yıl, arşivin 500 milyar sayfayı aşması bekleniyor. Lenchner, “Bu sadece rastgele net sayfaları değil, aslında dünyanın umurunda, çünkü 20.000 müşterimiz milyarlarca web kullanıcısını temsil ediyor” dedi.
Browser.ai Şirketin “endüstrinin ilk engellenemez, ai-yerli tarayıcısı” dediği şeyi temsil eder. Özerk AI ajanları için özel olarak tasarlanan bulut tabanlı hizmet, bot algılama sistemlerini tetiklemeden net sitelerine erişmek için insan davranışını taklit eder. Doğal dil komutlarını destekler ve uçuş rezervasyonu veya restoran rezervasyonları yapmak gibi karmaşık net etkileşimlerini gerçekleştirebilir.
Şirkete göre tarayıcı altyapısı günde 150 milyondan fazla net eylemini işliyor. Lenchner, önemli finansman sağlayan AI ajan şirketlerinden “Neredeyse hepsi müşteri” dedi. “Çünkü anladığımız ve anladıkları şey, bir net sitesine girme problemini engellenmeden ve net sitesinde net işlemleri yürütmeden çözüyoruz.”
MCP sunucuları (Mannequin Bağlam Protokolü) AI temsilcilerinin canlı verileri gerçek zamanlı olarak aramasını, taramasını ve çıkarmasını sağlayan düşük gecikmeli bir kontrol katmanı sağlar. Protokol, geliştiricilerin yalnızca eğitim verilerine güvenmek yerine mevcut bilgiler üzerinde hareket edebilen AI sistemleri oluşturmasına olanak tanır.
Patent portföyü ve proxy ağı, engellemeye karşı rekabetçi hendek oluşturun
Brilliant Knowledge’nın rekabet avantajı, Lenchner’ın net sitesi engelleme mekanizmalarının üstesinden gelmenin “takıntısı” olarak tanımladığı şeyden kaynaklanmaktadır. Şirket, teknolojisi hakkında 5.500’den fazla patent iddiasına sahiptir ve 195 ülkede 150 milyondan fazla IP adresi ile dünyanın en büyük vekil ağını işletiyor.
Lenchner, “İnternete çok iyi baktık” dedi. “Uzun zamandır interneti haritalıyoruz ve uzun zamandır da internetin büyük parçalarını arşivliyoruz.”
Şirketin yaklaşımı, basit otomatik komut dosyaları yerine gerçek cihazlar, IP adresleri ve tarayıcı parmak izlerini kullanarak insan davranışını taklit etmek için sofistike teknikler içerir. Bu, algılama ve engellemeyi net siteleri için son derece zorlaştırır.
Lenchner, “Pratik olarak bizi engellemenin tek yolu, verileri girişin arkasına koymak, o zaman denemeyeceğiz” dedi. “Bazen hemen çözmeyeceğimiz yeni bir engelleme mantığı var. Araştırma ekibimizi 12 saat, en çok üç gün gibi alacak ve kilidini açacağız.”
AI talebi Chatgpt sonrası patladığı için gelir 100 milyon doları aşıyor
Sırasında Parlak Veriler Özel bir sermaye firması tarafından özel olarak tutulan Lenchner, şirketin yıllık tekrar eden gelirinin birkaç yıl önce 100 milyon doları aştığı VentureBeat ile doğruladı. AI şirketleri eğitim verilerine ve gerçek zamanlı bilgilere erişmek için mücadele ederken, işletme 2022’nin sonlarında ChatGPT’nin piyasaya sürülmesinden bu yana patlayıcı büyüme yaşadı.
Lenchner, “GPT-3 dünyayı, AI’yı veya AI için verileri dediğimiz şey değiştirdiğinde, 2023 Mart’tan itibaren, bir şirket olarak bizim için kesinlikle patladı” dedi. “Diğer her şey de büyüyor, çünkü herkesin daha fazla veriye ihtiyacı var. Ancak bu kullanım durumu daha önce görmediğimiz hiçbir şey gibi.”
Şirket, Fortune 500 şirketleri ve büyük AI laboratuvarları da dahil olmak üzere 20.000’den fazla işletmeye hizmet vermektedir. Geleneksel müşteriler arasında rakip fiyatlandırma izleyen e-ticaret platformları, pazar istihbarat arayan finansal hizmetler firmaları ve iş araştırması yapan işletmeler bulunmaktadır.
GDPR uyumluluğu ve etik uygulamalar rakiplerden ayrım yapar
Parlak Veriler veri toplama konusundaki gizlilik kaygılarını ele almak için uyum altyapısına büyük yatırım yapmıştır. Şirket takip ediyor Avrupa GDPR Ve California CCPA düzenlemeler, kişisel bilgileri kamu kaynaklarından toplandığında ve silme seçenekleri sağladığında bireyleri otomatik olarak bildirir.
Lenchner, “Düzenleme ve mevzuat açıktır, çünkü Avrupa GDPR ve en azından California ve CCPA düzenlemeleri devreye girdi,” diye açıkladı Lenchner. “Örneğin, e -posta adresinizi toplarsak, dimension otomatik olarak ‘Hey, bu kim olduğumuz. Kişisel bilgilerinizi kamuya açık alandan topladık. İşte gözden geçirmek isterseniz tıklayabileceğiniz büyük bir düğme.’ ‘
Şirket, büyük bir uyum ekibini ve mahkeme işlemleri sırasında değerli olduğunu kanıtlayan uygulamalarının kapsamlı belgelerini sürdürmektedir. Lenchner, “İşletmeler özellikle bizi seviyoruz çünkü ABD mahkemelerinde iki kez incelenen etik stanızımız var” dedi.
Teknoloji devleri veri tekelleri ararken net erişim savaşları yoğunlaşıyor
Internet veri erişimi üzerindeki savaş, AI endüstrisindeki bilgi kontrolü ve rekabet avantajı konusunda daha geniş gerilimleri yansıtır. Yapay zeka sistemleri daha sofistike hale geldikçe, mevcut, kapsamlı net verilerine erişim giderek daha değerli ve tartışmalı hale gelir.
Lenchner, Google’ın net tarama yeteneklerine özel erişimi nasıl sürdürdüğüne benzer şekilde, net’in zaman içinde “daha kapalı” olacağını tahmin ediyor. “Birkaç teknoloji devi, acenteleriyle her net sitesine ücretsiz erişim sağlayacak” dedi. “Geri kalanların altyapımızı veya başkasının altyapısını kullanması gerekecek.”
Şirket ayrıca, pazarlama amacıyla AI chatbot’ları kazıyan işletmeler ve MCP gibi AI temsilcilerinin net hizmetleriyle daha etkili bir şekilde etkileşime girmesini sağlayan yeni protokollerin ortaya çıkması da dahil olmak üzere yeni eğilimleri gözlemliyor.
Lenchner, “Büyük miktarda veri tüketen bu adamların hepsi ve hepimiz onları kullanıyoruz, hepsi robotların beyinlerini inşa etmeye gidiyor” dedi. “Bir insanla konuşan bir sohbet botunuz olması sorun değil, çünkü sonunda bir robotun yapacağı şey bu.”
Robotic beyinleri ve ajan ekonomisi büyümenin bir sonraki aşaması
Brilliant Knowledge’nın net kazıma hizmetinden AI altyapı sağlayıcısına dönüşümü, yapay zeka endüstrisinin hızla gelişen ihtiyaçlarını yansıtıyor. Şirketler AI ajanlarını ve otonom sistemleri dağıtmak için acele ettikçe, gerçek zamanlı net verilerine erişim, bilgi işlem gücü ve algoritmik sofistike olmak kadar önemli hale gelir.
Brilliant Veri’nin mahkeme zaferleri aracılığıyla kurulan yasal emsaller, teknik yenilikleri kadar önemli olabilir ve tüm AI endüstrisinin net bilgilerini nasıl eriştiğini ve kullandığını potansiyel olarak şekillendirebilir. Büyük teknoloji platformları, kendi AI sistemlerini eşzamanlı olarak geliştirirken veri erişimini giderek kısıtlarken, parlak veriler gibi bağımsız altyapı sağlayıcılar AI ekosisteminde rekabetçi dengeyi korumak için gerekli olabilir.
“Biz bir altyapı şirketiyiz,” diye vurguladı Lenchner. “Hiçbir yere gitmeyen, sadece bilgisayarlarımızla oturup kod yazan çok yetenekli mühendisleriz. Bunu iyi yapıyoruz. Başka bir şey yapma niyetimiz yok.”
. Derin arama Beta, bir bekleme listesi aracılığıyla genel halka açık erişim ile iş müşterileri için Salı günü piyasaya sürülüyor. Browser.ai Ve MCP sunucuları Brilliant Knowledge’nın mevcut platformu aracılığıyla kurumsal müşteriler için zaten mevcuttur.
avots