Daha akıllı arama: Neden 'anlamsal arama' sonunda Google'ın sizi anlamasını sağlayacak?

Neden-semantik-arama'-nihayet-Google'ın-seni-anlamasına-izin verecek

Wall Street Journal'dan Amir Efrati bir makaleyle kaşlarını kaldırdı (abonelik gerekli), Google'ın daha fazla "anlamsal arama" teknolojisi sunarak İnternet aramasında rakiplerinin önünde kalmaya çalıştığını söylüyor. Buradaki fikir, Google'ın arama kutusunun yalnızca kullanıcıların anahtar kelimeleri veya özel olarak oluşturulmuş sorguları yazabileceği bir yer değil, aynı zamanda gerçek bir arama motoruna sahip bir kutu olacağıdır. anlayış İnsanların yazdığı birçok terimin, adın, fiilin ve referansın çoğunu bilir ve bu bilgiyi kullanıcıların aramalarına uygulayabilir. Teorik olarak anlamsal arama, arayan kişinin amacını yansıtan sonuçları döndürebilmelidir. bazı durumlarda Google'ın kullanıcıları başka bir yere yönlendirmeden hemen yanıt verme yeteneği artar alan.

Ama durun – bu yeni bir şey mi? Google değil mi çoktan bazı cevapları hemen öne koyar mısın? Anlamsal arama, Google'ın İnternet arama işindeki liderliğini korumasına potansiyel olarak nasıl yardımcı olabilir?

Önerilen Videolar

Semantik arama nedir?

Özetle anlambilimin, IBM'in süper bilgi işlem uygulaması Watson ile çok daha fazla ortak noktası vardır. insanları kolayca mağlup etti en Tehlike! Microsoft Word'deki Bul iletişim kutusunda olduğundan daha fazladır.

Kabaca söylemek gerekirse, bilgisayarlı arama dünyası iki türe ayrılıyor:

Değişmez arama (bazen denir gezinme araması) girilen terimlerin bir kısmı veya tamamı için tam eşleşmeleri arar ve eşleşen öğeleri (dosyalar, Web sayfaları, ürünler veya başka bazı ayrı bilgi birimleri) döndürür. Kelimenin tam anlamıyla arama, aramayı faydalı şekillerde genişleten veya kısıtlayan kök eşleştirme, eşlenikler ve ilişkilendirme gibi şeylerle artırılabilir. "uçmak" kelimesi aynı zamanda "uçuş" kelimesine de denk gelebilir. Kelimenin tam anlamıyla arama, bugün en aşina olduğumuz şeydir, çünkü kısmen bilgisayarlar için en kolay aramadır. rol yapmak.

Anlamsal arama Gerçek aramadan iki açıdan farklılık gösterir. İlk olarak anlamsal arama, anlamak Sorgunun terimlerinin ve dilinin analizi yoluyla, kullanıcının bir sorguda ne sorduğunu bağlam içine yerleştirerek. Bu analiz, potansiyel olarak kullanıcı hakkındaki bilgileri de içeren, sıkı bir şekilde önceden derlenmiş bilgi havuzlarına göre gerçekleştirilir. İkinci olarak anlamsal arama, bir dizi dosyayı, Web sayfasını, ürünü veya diğer öğeleri döndürmek yerine, anlamsal aramanın bir sonuç sağlamaya çalışır. doğrudan bir soruya cevap. Anlamsal bir arama motoruna “Plüton ne zaman keşfedildi?” diye sorarsanız. "Plüton 18 Şubat 1930'da Clyde Tombaugh tarafından keşfedildi" diye cevap verebilir*Kelimenin tam anlamıyla bir arama motoru büyük olasılıkla "keşfedildi" ve "Plüton" sözcüklerini içeren Web sayfalarına bağlantılar döndürecektir.

Gerçek arama ve anlamsal aramanın farklı görevler için iyi olduğu ortaya çıktı. Bir kullanıcı belirli bir şeyi aradığında, gerçek arama harikadır şey, bunun bir dosya, Web sayfası, belge, ürün, albüm veya başka ayrı bir öğe olup olmadığı. Öte yandan anlamsal aramanın, kullanıcı belirli bir şeyi aradığında daha kullanışlı olduğu ortaya çıkıyor. bilgi — tarih, sayı, saat, yer veya ad gibi.

Kelime işlemcilerden Web arama motorlarına kadar her şeyde gerçek arama teknolojisinin yaygınlaşması sayesinde, en çok gerçek aramaya alışkınız. Çoğumuz, bizi ilk denemede istediğimiz şeye yaklaştırmak için gerçek aramayı nasıl yönlendireceğimizi zaten biliyoruz. Ancak Efrati'nin WSJ makalesine göre Google, anlamsal arama teknolojisinin Web aramalarının yüzde 10 ila 20'sine doğrudan yanıt verebileceğine inanıyor. Comscore'a göre Google 11,7 milyar arama gerçekleştirdi Şubat 2012'de yalnızca Amerika Birleşik Devletleri'nde. Anlamsal arama yetenekleri sayesinde, insanları diğer Web sayfalarına ve sitelere yönlendirmek yerine, bu aramaların 2,3 milyardan fazlası doğrudan yanıtlanabilirdi.

Google bunu zaten yapmıyor mu?

Google Web aramasını kullandıysanız muhtemelen "Ama durun, Google bunu zaten yapıyor!" diye düşünüyorsunuzdur. Tip "Tokyo'da şu anki saat" veya "Everest Dağı ne kadar yüksek”ve Google, kesin bir cevaba ilişkin en iyi tahminini arama sonuçlarının en üstüne koyacaktır. Google, yanıtı için kaynaklardan bile alıntı yapıyor ve bu kaynaklardan bazıları yanıtın altındaki klasik "on mavi bağlantıda" yer alacak. (Bu arada Google, Everest Dağı'nın 8.848 metre yüksekliğinde olduğunu bildiriyor.)

Adil olmak gerekirse, bu, Google'ın arama çubuğuna yerleştirdiği birçok yararlı özellikten biridir: (Gelişmiş) matematik yapacak, gerçekleştirecek birim ve para birimi dönüştürmeleri yapın ve uçuş bilgileri ve yerel film gösterim saatleri gibi şeyleri görüntüleyin; karmaşık bir şey yazmanıza gerek yok sorgu. Ayrıca bazı genel veri kaynaklarına da erişebilir. Örneğin “ yazaraknüfus MeksikaArama kutusuna ” yazıldığında Dünya Bankası verileri görüntülenecektir. Bugünkü yanıt 113.423.047 kişidir.

Ancak Google'ın bazı soru türlerine doğrudan yanıt verme çabaları oldukça hızlı bir şekilde sonuçsuz kalıyor çünkü bu özellikler büyük ölçüde Kullanıcının ne istediğini anlamaya çalışan semantik bir arama yerine, Google'ın gerçek arama motoruna özel durumlar olarak uygulanır. istiyor. Tip "everest dağı ne kadar uzun” (yazılıma dikkat edin) arama kutusuna girer ve Google bir yanıt sağlamaya bile çalışmaz: Google arama, “mt”nin “bağlama” anlamına geldiğini bilmez. Benzer şekilde, Google mevcut konumunuzun Meksika'da olmadığını belirlediyse (ve konumunuzu Google bilmiyorsa IP adresinize göre tahminde bulunacaktır) Ve, hayır, vazgeçemezsin) " için arama yapıyornüfus meksika şehri” bazı beklenmedik sonuçlar verebilir. Elbette Mexico City 10.852'den fazla insana ev sahipliği yapıyor, değil mi?

Semantik aramanın farkı nedir?

Anlamsal arama bu tür gafları iki şekilde ortadan kaldırmaya çalışır. Öncelikle konuyu daha doğru anlamaya çalışır. niyet belirli bir sorgunun arkasında. İkinci olarak, anlamlı bir yanıt bulup bulamayacağını görmek için bu sorgunun öğelerini önceden derlenmiş derin bilgi havuzlarıyla eşleştirmeye çalışır.

Google gibi gerçek bir arama motoruna bir sorgu gönderdiğinizde, sorgu anında İnternetteki her siteye göz atın ve sizin sitenizle en iyi eşleştiğini düşündüğü sitelerin listesini rapor edin. şartlar. Bunun yerine, Google'ın sürekli olarak yeni siteler ve yeni Web sayfaları bulmak için İnternet'i tarayan yazılım programları vardır. indeks Buldukları tüm sayfalardan. Her ne kadar bu aşırı basitleştirme olsa da, kullanıcılar şöyle bir arama sorgusu yazdıklarında "Yalta konferansıGoogle, bu dizine hem "Yalta" hem de "konferans"la eşleşen sayfaların yanı sıra her iki terimin de birbirine yakın olduğu (örneğin 8 veya 10 kelime dahilinde) sayfalar için bakar. Google daha sonra bu sayfaların URL'lerini toplar, dahili PageRank'ine (Google'ın, bir sayfanın göreceli değerlerine ilişkin, temelde kendisine verilen bağlantıları olumlu oylar olarak sayan ölçüsü) göre sıralar ve bir liste döndürür.

Böyle bir sürecin arkasındaki veri yönetimi ve mühendislik hem göz korkutucu hem de devasadır ve Google Bunu başardığı için övgüyü hak ediyor - özellikle de Google bunu genellikle çok kısa bir sürede yapabildiğinden ikinci. Benzer şeyler Microsoft'un Bing'inde de perde arkasında yaşanıyor.

Anlamsal bir arama aynı sorguya farklı şekilde yaklaşacaktır. Anlamsal bir arama motoru, bir sorguyu önceden derlenmiş (ve sürekli güncellenen) bir Web sayfaları dizini ile karşılaştırmak yerine, sorguyu ayrı, önceden derlenmiş bir sorguyla karşılaştırır. bilgi setleri mevcut. Bilgi kümelerini veritabanları gibi düşünün: Özünde, belirli bir konuyla ilgili veriler, gerçekler ve rakamlarla doludurlar. Farklı türde bilgi kümeleri vardır. Birkaç ilginç olanı: ontolojiler (kurallar, işlevler ve kısıtlamalarla değiştirilebilen resmileştirilmiş bilgileri temsil eden) ve halksonomileri, genellikle iş birliğiyle tanımlanan bilgi kümelerini temsil eder: Örnekler hashtag'ler ve sosyal yer imleridir.

Google arama

Bilgi setleri depolama kutularından daha fazlasıdır. Ayrıca bilgi tabanındaki öğeler arasındaki ilişkileri temsil eder ve bilgilerin tüm platformlarda anlamlı bir şekilde kullanılmasını sağlarlar. çoklu bilgi kümeleri. Ayrıca ilişkiler sıklıkla doğru mantıksal çıkarımların yapılabildiği şekilde ifade edilir. olmadan mümkün olan tüm türev verileri depolamak zorunda kalmak. Bu biraz antropomorfizasyondur, ancak semantik arama motorları, bildikleri veriler üzerinde temel akıl yürütme ve çıkarımlar yapabilir. Bu sürecin bir parçası olarak, anlamsal arama motorları genellikle kendi türetmelerine olan güven düzeyini değerlendirmek üzere tasarlanmıştır. Ne hakkında konuştuklarını bilmediklerini düşünürlerse sessiz kalabilirler. Eğer oldukça eminlerse, bir cevap verirler.

Yani anlamsal bir arama motoruna "Yalta konferansı" girerseniz, bilgi kümelerine bakar ve muhtemelen bazı temel gerçekleri ve rakamları ortaya çıkarır. “4-11 Şubat 1945.” Bu, Stalin, Churchill ve Franklin Roosevelt'in katıldığını gösteriyor olabilir ve bu, Dünya Savaşı'nın son aylarında bile önemliydi. II. Oldukça basit şeyler.

Gerçek bir arama motoruna sorarsanız “Yalta Konferansı Kore Savaşı sırasında mı gerçekleşti?” muhtemelen on mavi bağlantıdan oluşan bir liste alacaksınız. Birinin bir cevabı olabilir.

Ancak anlamsal bir arama motoruna sorarsanız tek kelimelik bir yanıt almalısınız: "Hayır."

O Anlamsal aramanın inanılmaz derecede ilginç hale geldiği yer burasıdır.

Bu Wolfram Alpha değil mi?

Bu sorgular insanların sorduğu türden şeylere benziyorsa Wolfram Alfa arama motoru, kesinlikle haklısın. Wolfram Alpha, Web sayfalarının bir dizini olmaktan ziyade bir bilgi motoru olmaya çalışır. Wolfram Alpha, bir şeyi (bir Web sayfası gibi) aramakla değil, bir cevap istemekle ilgilidir. Wolfram Alpha, sonuçlarını üretmek için önceden derlenmiş bilgi tabanlarına güvenmektedir ve şirket düzenli olarak yeni bilgi tabanları eklemekte ve güncellemektedir. Bazıları son derece uzmanlaşmış teknik verilerdir (kimyasal elementler veya meyve sineğinin genomu hakkındaki bilgiler gibi), diğerleri ise daha tuhaftır. Örneğin Wolfram Alpha kedi ırkları hakkında oldukça fazla bilgi sahibidir.

Wolfram Alpha'nın bilgisi dahilinde kaldığınız sürece, verilerin yararlı analizini gerçekleştirebilir. Örneğin Wolfram Alpha şunları yapabilir: aslanlarla kaplanların atlama mesafelerini karşılaştırın. (Benzer olduğu ortaya çıktı, ancak kaplanlar genellikle aslanları geride bırakıyor gibi görünüyor.) Ama bilmek istiyorsanız kanguru ne kadar uzağa sıçrayabilir? Hata! Üzgünüm: Veri yok.

Ancak kanguru şerbetçiotuyla ilgili başarısız sorgu, Wolfram Alpha'nın olayları nasıl anlamaya çalıştığı hakkında biraz bilgi veriyor. Cevap vermeden önce motor, "kanguru"nun "kangurular" anlamına geldiğini varsaydığını belirtiyor. valabies” ancak kullanıcılar antilopin kanguru, kırmızı kanguru veya doğu grisine geçiş yapabilirler. kanguru. Benzer şekilde Wolfram Alpha, "bir kanguru ne kadar uzağa sıçrayabilir" ifadesini hayvanlar hakkında sahip olabileceği belirli bir veri noktası olan "atlama mesafesi" sorgusu olarak yorumladı. Görünüşe göre Wolfram Alpha şu anda bu verilere sahip değil, ancak sorguyu yorumlaması çok önemli.

Bu Siri değil mi?

Bu sorgular, insanların iPhone 4S'te Siri'ye yönelttiği türden sorulara benziyorsa (ama unutmayın, Olumsuz Bu hafta piyasaya çıkan yeni iPad), kesinlikle haklısın. Ancak Siri'nin denklemin yalnızca yarısını ele aldığını unutmamak önemlidir: kullanıcının sorgularını anlamak. Bunu yaparken Siri, bir kullanıcının mikrofon üzerinden yaptığı konuşmanın gerçek zamanlı olarak doğru bir şekilde tanınması gibi çok zorlu bir bilgi işlem sorununu üstleniyor. Bu küçük bir başarı değil, ancak anlamsal bir arama motoru değil. Perde arkasında Siri, sorguları Wolfram Alpha'ya, Yelp'e ve (her şey başarısız olursa) kullanıcının tercih ettiği Web arama motoruna dağıtıyor. Siri'ye "Yalta Konferansı Kore Savaşı sırasında mı oldu?" diye sorarsanız, ne olduğunu doğru bir şekilde tanıyabilir. siz soruyorsunuz - benim için öyle oldu - ama sadece eski usul gerçek bir Web araması yapmayı teklif edecek Sen.

siri

Ne bekleyebileceğinizi

Google'ın anlamsal aramaya ilgisi muhtemelen iki yönlüdür. Birincisi, muhtemelen teknolojiyi, kendisini rakiplerinin (çoğunlukla Microsoft Bing) önüne koyacak başka bir övünme noktası olarak kullanmak istiyor. Bing'in uzun süredir Wolfram Alpha ile ortaklık Arama motorunun mümkün olduğunda doğrudan yanıtlar vermesine yardımcı olmak için tasarlanmıştır. Ancak şu ana kadar ne Bing ne de Google, doğrudan arama sonuçlarıyla tüketicilere ulaşmada büyük bir ilerleme kaydedemedi. Sonuçta, çoğu günlük arama kullanıcısı muhtemelen (sınırlı) yeteneklerin zaten mevcut olduğunu bilmiyor. Bunlardan haberdar olan kullanıcılar için bile Google bile bu teknolojinin aramaların yalnızca yüzde 10 ila 20'si için geçerli olduğunu düşünüyor. Bu çok fazla arama demek, ancak aramaların çoğunluğunun (yüzde 80 ila 90) bunu kullanmayacağı anlamına geliyor.

Ancak tüketiciler dizüstü bilgisayarları, masaüstü bilgisayarları ve geleneksel bilgi işlem platformlarını hızla terk ettikçe, karmaşık arama sorgularına kısa, kolay anlaşılan yanıtlar sağlama yeteneği daha da gelişebilir. çok mobil dünyada önemli. Araç kullanan veya tuş takımları veya ekran klavyeleriyle uğraşmak istemeyen kullanıcılar için, "Golden Gate Park mı?" gibi sesli sorulara yanıt verme yeteneği Central Park'tan daha mı büyük?" veya "Malcolm'un dairesine hangi yol?" "Evet" ve "Sonraki sola dön" gibi basit yanıtlar, mobil cihazlar için çok değerli farklılaştırıcı unsurlar olabilir platformlar.

Apple ve Google gibi şirketlerin teknolojiyi almak istediği yer neredeyse kesinlikle burası.

* Tombaugh, Plüton'u ilk kez 18 Şubat 1930'da hareketli bir nesne olarak tanımladı, ancak Plüton daha önce de birkaç kez farkında olmadan tespit edilmişti. Şu anda bilinen en eskisi 1909'daydı. Görmek? Bilgi kaygandır.

Fotoğraf: Annette Shaff / Shutterstock.com

Editörlerin Önerileri

  • İnternetin tamamı artık Google'ın yapay zekasına ait
  • Bing'i kullanmanıza gerek yok; Google Arama'da artık yapay zeka da var
  • Hata — Google Bard AI demosu ilk arama sonucuyla çürütüldü
  • Google Arama'nın tıklama tuzağıyla nasıl başa çıkmayı planladığı aşağıda açıklanmıştır
  • Kişisel bilgiler Google aramadan nasıl kaldırılır