Amir Efrati del Wall Street Journal ha sollevato le sopracciglia con un articolo (abbonamento richiesto) affermando che Google sta lavorando per stare al passo con i suoi rivali nella ricerca su Internet introducendo una maggiore tecnologia cosiddetta di "ricerca semantica". L'idea è che la casella di ricerca di Google non sia solo un luogo in cui gli utenti possano digitare parole chiave o query specificatamente formulate, ma una casella con un vero e proprio comprensione di molti dei termini, nomi, verbi e riferimenti digitati dalle persone e potrebbe applicare tale conoscenza alle ricerche degli utenti. In teoria, la ricerca semantica dovrebbe essere in grado di restituire risultati che riflettono l’intento di chi ricerca, e in alcuni casi migliorano la capacità di Google di fornire una risposta immediata senza indirizzare gli utenti a un altro luogo.
Ma aspetta: c'è qualcosa di nuovo? Non Google Già mettere alcune risposte subito? E come potrebbe la ricerca semantica aiutare Google a mantenere la propria leadership nel settore della ricerca su Internet?
Video consigliati
Cos'è la ricerca semantica?
In poche parole, la semantica ha molto più in comune con Watson, l'applicazione di supercalcolo IBM che sconfissero facilmente gli esseri umani A Pericolo! rispetto alla finestra di dialogo Trova di Microsoft Word.
In parole povere, il mondo della ricerca computerizzata si divide in due tipologie:
Ricerca letterale (a volte chiamato ricerca navigazionale) cerca corrispondenze esatte per alcuni o tutti i termini immessi e restituisce gli elementi corrispondenti, siano essi file, pagine Web, prodotti o altre unità discrete di informazioni. La ricerca letterale può essere aumentata con cose come la corrispondenza delle radici, i coniugati e l'associazione che espandono o restringono la ricerca in modi utili, quindi la ricerca di “volare” potrebbe anche trovare “volo”. La ricerca letterale è ciò con cui abbiamo più familiarità oggi, in parte perché è la più semplice da eseguire per i computer eseguire.
Ricerca semantica differisce dalla ricerca letterale in due modi. Innanzitutto, la ricerca semantica tenta di farlo capire ciò che un utente chiede in una query inserendolo nel contesto attraverso l'analisi dei termini e del linguaggio della query. Questa analisi viene condotta rispetto a pool di conoscenze strettamente precompilati, che potenzialmente includono la conoscenza dell'utente. In secondo luogo, invece di restituire un insieme di file, pagine Web, prodotti o altri elementi, la ricerca semantica tenta di fornire un file diretto risposta ad una domanda. Se chiedi a un motore di ricerca semantico “Quando è stato scoperto Plutone?” si potrebbe rispondere “Plutone è stato scoperto il 18 febbraio 1930 da Clyde Tombaugh*”, dove un motore di ricerca letterale molto probabilmente restituirebbe collegamenti a pagine Web che contengono le parole “scoperto” e “Plutone”.
Si scopre che la ricerca letterale e la ricerca semantica sono utili per compiti diversi. La ricerca letterale è ottima quando un utente cerca qualcosa di specifico cosa, che si tratti di un file, di una pagina Web, di un documento, di un prodotto, di un album o di un altro elemento distinto. La ricerca semantica, d'altra parte, risulta essere più utile quando un utente cerca qualcosa di specifico informazione - come una data, un numero, un'ora, un luogo o un nome.
Grazie in parte alla proliferazione della tecnologia di ricerca letterale in ogni ambito, dagli elaboratori di testo ai motori di ricerca Web, siamo più abituati alla ricerca letterale. Molti di noi sanno già come manipolare la ricerca letterale per avvicinarci a ciò che vogliamo al primo tentativo. Tuttavia, secondo l’articolo di Efrati sul WSJ, Google ritiene che la tecnologia di ricerca semantica potrebbe fornire risposte dirette tra il 10 e il 20% delle ricerche sul Web. Secondo Comscore, Google ha gestito 11,7 miliardi di ricerche solo negli Stati Uniti nel febbraio 2012. Grazie alle funzionalità di ricerca semantica, si sarebbe potuto rispondere direttamente a più di 2,3 miliardi di tali ricerche, invece di indirizzare le persone verso altre pagine e siti Web.
Google non lo fa già?
Se hai utilizzato la ricerca web di Google probabilmente starai pensando "Ma aspetta, Google lo fa già!" Tipo "ora attuale a Tokio" O "quanto è alto il monte Everest" e Google inserirà la sua ipotesi migliore per una risposta precisa in cima ai risultati di ricerca. Google cita anche le fonti per la sua risposta, e alcune di queste fonti si troveranno nei classici “dieci collegamenti blu” sotto la risposta. (A proposito, Google riporta che il Monte Everest è alto 8.848 metri.)
Per essere onesti, questa è una delle tante funzionalità utili che Google ha integrato nella sua barra di ricerca: farà calcoli (sofisticati), eseguirà conversioni di unità e valuta e visualizza informazioni come informazioni sui voli e orari dei film locali: non è necessario digitare complicate domanda. Può anche attingere ad alcune fonti di dati pubbliche. Ad esempio, digitando "popolazione del Messico"Nella casella di ricerca verranno visualizzati i dati della Banca Mondiale. La risposta oggi è di 113.423.047 persone.
Tuttavia, gli sforzi di Google per fornire risposte dirette ad alcuni tipi di domande falliscono piuttosto rapidamente, perché tali funzionalità sono in gran parte inutilizzabili implementati come casi speciali al motore di ricerca letterale di Google, piuttosto che come una ricerca semantica che cerca di capire cosa dice l’utente vuole. Tipo "quanto è alto il monte everest" (nota l'ortografia) nella casella di ricerca e Google non tenta nemmeno di fornire una risposta: la ricerca di Google non sa che "mt" significa "montare". Allo stesso modo, se Google ha determinato che la tua posizione attuale non è in Messico (e, se Google non ha la tua posizione, indovinerà dal tuo indirizzo IP E, no, non puoi rinunciare) alla ricerca di "popolazione di città del messico" potrebbe restituire alcuni risultati inaspettati. Sicuramente Città del Messico ospita più di 10.852 persone, giusto?
In che modo la ricerca semantica è diversa
La ricerca semantica cerca di eliminare questo tipo di gaffe in due modi. Innanzitutto, cerca di comprendere più accuratamente il intento dietro una particolare query. In secondo luogo, tenta di abbinare gli elementi di quella query con pool precompilati di conoscenza approfondita per vedere se riesce a trovare una risposta significativa.
Quando invii una query a un motore di ricerca letterale come Google, questa non viene immediatamente visualizzata tutti i siti su Internet, esaminali e riporta un elenco di siti che ritiene più adatti al tuo termini. Invece, Google dispone di programmi software che scandagliano costantemente Internet alla ricerca di nuovi siti e nuove pagine Web, che creano un file indice da tutte le pagine che trovano. Sebbene si tratti di una semplificazione eccessiva, quando gli utenti digitano una query di ricerca come "Conferenza di Yalta", Google esamina quell'indice per le pagine che corrispondono sia a "Yalta" che a "conferenza", nonché alle pagine che hanno entrambi i termini vicini l'uno all'altro (ad esempio, entro 8 o 10 parole). Google quindi raccoglie gli URL di quelle pagine, li ordina in base al PageRank interno (la misura di Google dei meriti relativi di una pagina che sostanzialmente conta i collegamenti ad essa come voti positivi) e restituisce un elenco.
La gestione dei dati e l'ingegneria alla base di un processo del genere sono scoraggianti e gigantesche, e lo stesso vale per Google merita complimenti per averlo realizzato, soprattutto perché Google è spesso in grado di farlo in una frazione di a secondo. Cose simili accadono dietro le quinte di Bing di Microsoft.
Una ricerca semantica si avvicinerebbe alla stessa query in modo diverso. Invece di confrontare una query con un indice precompilato (e costantemente aggiornato) di pagine Web di cui è a conoscenza, un motore di ricerca semantico confronta la query con indici discreti e precompilati insiemi di conoscenze ha a disposizione. Pensa ai set di conoscenze come ai database: in fondo, sono pieni di dati, fatti e cifre su un particolare argomento. Esistono diversi tipi di insiemi di conoscenza. Un paio di quelli interessanti lo sono ontologie (che rappresentano informazioni formalizzate che possono essere manipolate con regole, funzioni e restrizioni) e folksonomie, che di solito rappresentano insiemi di conoscenze definiti in modo collaborativo: esempi potrebbero essere hashtag e social bookmark.
I set di conoscenze sono più che semplici contenitori di archiviazione. Rappresentano inoltre le relazioni tra gli elementi della base di conoscenza e consentono un utilizzo significativo delle informazioni multiplo insiemi di conoscenze. Inoltre, le relazioni sono spesso espresse in modo tale da poter fare inferenze logiche accurate senza dover memorizzare tutti i possibili dati derivati. Questo è un po’ antropomorfizzante, ma i motori di ricerca semantici possono eseguire ragionamenti e deduzioni di base sui dati di cui sono a conoscenza. Come parte di questo processo, i motori di ricerca semantici sono spesso progettati per valutare il livello di fiducia che hanno nelle loro derivazioni. Se pensano di non sapere di cosa stanno parlando, potrebbero rimanere muti. Se sono abbastanza sicuri, sputeranno una risposta.
Quindi, se inserisci “conferenza di Yalta” in un motore di ricerca semantico, cercherà nei suoi set di conoscenze e probabilmente spunterà alcuni fatti e cifre di base, forse “Dal 4 all’11 febbraio 1945.” Potrebbe indicare la presenza di Stalin, Churchill e Franklin Roosevelt, ed è stato un evento importante anche negli ultimi mesi della guerra mondiale II. Roba piuttosto semplice.
Se chiedi a un motore di ricerca letterale “La Conferenza di Yalta ebbe luogo durante la guerra di Corea?"probabilmente otterrai solo un elenco di dieci collegamenti blu. Si potrebbe avere una risposta.
Tuttavia, se chiedi a un motore di ricerca semantico, dovresti ottenere una risposta di una sola parola: “No”.
Quello è qui che la ricerca semantica diventa incredibilmente interessante.
Non è questo Wolfram Alpha?
Se queste domande suonano come il genere di cose che le persone lanciano al Wolfram Alpha motore di ricerca, hai esattamente ragione. Piuttosto che essere un indice di pagine Web, Wolfram Alpha tenta di essere un motore di conoscenza. Wolfram Alpha non riguarda la ricerca di qualcosa (come una pagina Web), ma la richiesta di una risposta. Wolfram Alpha si affida a basi di conoscenza precompilate per produrre i propri risultati e l'azienda aggiunge e aggiorna regolarmente nuove basi di conoscenza. Alcuni sono dati tecnici altamente specializzati – come informazioni sugli elementi chimici o sul genoma della mosca della frutta – mentre altri sono più stravaganti. Ad esempio, Wolfram Alpha sa molto sulle razze di gatti.
Finché rimani nell’ambito della conoscenza di Wolfram Alpha, può eseguire analisi utili dei dati. Ad esempio, Wolfram Alpha può confronta le distanze di salto di leoni e tigri. (Si scopre che sono paragonabili, ma le tigri sembrano generalmente superare i leoni.) Ma se vuoi saperlo quanto lontano possono saltare i canguri? Spiacenti, scusa: nessun dato disponibile.
Ma la query fallita sul salto del canguro mostra qualcosa su come Wolfram Alpha cerca di capire le cose. Prima di fornire una risposta, il motore indica che presuppone che "canguro" significhi "canguro, wallaby", ma gli utenti possono passare al canguro antilopino, al canguro rosso o al canguro grigio orientale canguro. Allo stesso modo, Wolfram Alpha ha interpretato “quanto lontano può saltare un canguro” come una query per “distanza di salto”, un punto dati specifico che potrebbe avere sugli animali. Risulta che Wolfram Alpha al momento non dispone di tali dati, ma la sua interpretazione della query è molto importante.
Non è Siri?
Se queste domande assomigliano al genere di cose che la gente lancia a Siri nell'iPhone 4S (ma, ricorda, non il nuovo iPad che debutterà questa settimana), hai esattamente ragione. Tuttavia, è importante ricordare che Siri affronta solo metà dell’equazione: comprendere le domande dell’utente. In tal modo, Siri affronta il difficile problema informatico di riconoscere accuratamente il parlato di un utente al microfono in tempo reale. Non è un’impresa da poco, ma non è un motore di ricerca semantico. Dietro le quinte, Siri trasmette le query a Wolfram Alpha, Yelp e (se tutto il resto fallisce) al motore di ricerca Web preferito dall'utente. Se chiedi a Siri “La Conferenza di Yalta è avvenuta durante la guerra di Corea”, potrebbe riconoscere con precisione cosa stai chiedendo - lo ha fatto per me - ma offrirà semplicemente di fare una ricerca sul Web letterale della vecchia scuola per Voi.
Cosa aspettarsi
L’interesse di Google per la ricerca semantica è probabilmente duplice. In primo luogo, probabilmente vorrà utilizzare la tecnologia come ulteriore punto di vanto che la pone davanti alla concorrenza, soprattutto Microsoft Bing. Bing ha da tempo un collaborazione con Wolfram Alpha progettato per aiutare il motore di ricerca a fornire risposte dirette quando possibile. Tuttavia, finora né Bing né Google sono riusciti a raggiungere i consumatori con risultati di ricerca diretti. Dopotutto, la maggior parte degli utenti che effettuano ricerche quotidiane probabilmente non sanno che le funzionalità (limitate) esistono già. Anche per gli utenti che ne sono a conoscenza, anche Google sembra ritenere che la tecnologia sia applicabile solo al 10-20% delle ricerche. Si tratta di molte ricerche, ma significa che la maggior parte (dall'80 al 90%) delle ricerche non lo utilizzerà.
Tuttavia, poiché i consumatori abbandonano rapidamente notebook, desktop e piattaforme informatiche tradizionali, la capacità di fornire risposte brevi e facilmente comprensibili a query di ricerca complesse potrebbe diventare molto importante nel mondo mobile. Per gli utenti che guidano o che non sono disposti a giocherellare con i tastierini o le tastiere su schermo, la possibilità di rispondere a domande vocali come "Il Golden Gate Park?" più grande di Central Park?» o "Da che parte per l'appartamento di Malcolm?" con risposte semplici come "Sì" e "Prendi la prossima a sinistra" potrebbero costituire preziosi elementi di differenziazione per i dispositivi mobili piattaforme.
È quasi certamente lì che aziende come Apple e Google stanno cercando di portare la tecnologia.
* Tombaugh identificò per la prima volta Plutone come oggetto in movimento il 18 febbraio 1930, ma Plutone era stato involontariamente avvistato in diverse occasioni precedenti. Il primo attualmente conosciuto risale al 1909. Vedere? La conoscenza è sfuggente.
Foto tramite: Annette Shaff / Shutterstock.com
Raccomandazioni degli editori
- Tutta Internet ora appartiene all’intelligenza artificiale di Google
- Non è necessario utilizzare Bing: ora anche la Ricerca Google dispone dell'intelligenza artificiale
- Spiacenti, la demo di Google Bard AI è smentita dal primo risultato di ricerca
- Ecco come la Ricerca Google intende affrontare il clickbait
- Come rimuovere informazioni personali dalla ricerca di Google