Inside Knowledge Graph: la búsqueda semántica profunda de Google

Google está comenzando a implementar su nueva tecnología Knowledge Graph para sus usuarios de habla inglesa en los Estados Unidos. Aunque el nuevo servicio aparecerá como un complemento de los resultados de búsqueda web normales de Google, en lugar de que un servicio separado por derecho propio: representa una forma fundamentalmente diferente de abordar buscar. En lugar de devolver resultados de búsqueda clasificados según términos de búsqueda literales (o algunos términos de búsqueda, o versiones posiblemente corregidas de algunos de los términos de búsqueda), Knowledge Graph esencialmente intenta asociar la búsqueda consultas con cosa sabe sobre: lugares, personas, libros, películas, eventos, lo que sea. Knowledge Graph es un esfuerzo por lograr búsqueda semántica, intentando devolver resultados basados en el significado de lo que buscan los usuarios, en lugar de solo coincidencias literales.

¿Puede el Knowledge Graph cambiar la forma en que buscamos? ¿Y qué podría significar para el negocio fundamental de Google y para los sitios que dependen de Google para atraer tráfico a sus sitios?

Vídeos recomendados

Gráfico de conocimiento debajo del capó

Gráfico de conocimiento de Google (Curie)

Aunque Knowledge Graph es un tipo fundamentalmente nuevo de oferta de búsqueda de Google, sigue caminos muy transitados que Google ha estado siguiendo durante años con su principal servicio de búsqueda. Y Google está teniendo cuidado de presentarlo de una manera que no perturbe demasiado sus búsquedas que dominan el mercado.

Relacionado

El rival ChatGPT de Google acaba de lanzarse en las búsquedas. He aquí cómo probarlo
Vaya, la demostración de Google Bard AI es refutada por el primer resultado de búsqueda
Google acaba de revelar lo que le pareció más fascinante en 2022

Durante años, Google ha podido responder a una selección de consultas objetivas sencillas directamente desde la búsqueda. barra e incluso hacer algunos cálculos, algo útil para las personas que tienen más probabilidades de tener un navegador web en ejecución que un calculadora. Pruébelo: Google debería proporcionar respuestas directas a cosas como "capital de surinam" o "raíz cuadrada 3952.”

Con Knowledge Graph, Google también incluirá consultas de búsqueda en bases de datos complejas de información interrelacionada sobre... bueno, cosas, por falta de mejores condiciones. En cierto modo, estas bases de datos funcionan de manera muy similar a una búsqueda tradicional: devuelven registros con información importante sobre un tema en particular. Para una persona, eso podría ser algo como su fecha de nacimiento (y tal vez la fecha de muerte), sus nacionalidades, títulos u cargos que pudo haber ocupado, nombre legal completo y más.

Para un edificio, estos conjuntos de datos pueden incluir cosas como su ubicación, cuándo se construyó, su tamaño total, su tipo (por ejemplo, monumento, espacio comercial, residencia, um... ¿estación espacial?). Sin embargo, además de unos pocos datos básicos y algunas palabras clave, estas entradas de la base de datos también recopilan enlaces directos a relacionado objetos en la base de datos (que a su vez se vinculan a otros objetos relacionados, etc.). Con toda probabilidad, la naturaleza de esos vínculos también está definida. Por ejemplo, una entrada sobre una persona puede contener enlaces a los padres, cónyuge(s) e hijos de esa persona, y otras relaciones significativas y ser capaz de distinguir entre miembros de la familia y otros tipos de relaciones. La base de datos no estaría haciendo su trabajo si un conjunto de datos sobre George H. w. Bush (el 41º presidente de los Estados Unidos) no vinculó el conjunto de datos sobre George W. Bush (el presidente número 43), y ambos se vincularían con Condoleezza Rice, pero de diferentes maneras. Un conjunto de datos sobre la Gran Pirámide debería incluir vínculos con Keops, Keops y La Esfinge, pero también con el Mausoleo de Halicarnaso. (Puedes adivinar por qué?)

Estos conjuntos de datos constituyen el corazón de la búsqueda semántica y no son baratos. En primer lugar, son enormes: la suma del conocimiento humano puede ser sólo una pequeña partícula frente a todos los información en el universo, pero simplemente eliminar el servicio puede producir fácilmente cientos de millones (o miles de millones) de conjuntos de datos. (En comparación, la versión inglesa de Wikipedia tiene apenas unos 4 millones de artículos). Estos conjuntos de datos no son fáciles de obtener: deben compilarse minuciosamente a partir de fuentes confiables. Además, deben organizarse y diseñarse de tal manera que se pueda acceder a la información y manipularla de manera útil (y en tiempo real, para los fines de Google). Y los conjuntos de datos deben poder hacer frente a la naturaleza maleable del "conocimiento". Después de todo, hace apenas unos años, Plutón era un planeta y Vioxx era un tratamiento para la osteoartritis aprobado por la FDA.

Aparentemente, Google está construyendo sus bases de datos utilizando tecnologías y métodos adquiridos con Metaweb en 2010, aunque Metaweb base libre La base de datos semántica permanece disponible para cualquiera. Google está utilizando Freebase para obtener datos, junto con información extraída de Wikipedia y la Libro de datos mundiales de la CIA. Google reclamos su base de datos Knowledge Graph ya tiene entradas para unos 500 millones de objetos (tenga en cuenta que estos objetos no se pueden comparar directamente con Artículos de Wikipedia) y unos 3.500 millones de “hechos”. Ponemos "hecho" entre comillas porque alguna vez fue un "hecho" que la Tierra era plana y los humanos no podía volar. El conocimiento es resbaladizo.

Gráfico de conocimiento en la pantalla

La implementación inicial de Knowledge Graph por parte de Google está diseñada para aumentar las listas de resultados de búsqueda existentes de la empresa, en lugar de reemplazarlas. Así como Google a veces muestra vistas previas de páginas en un panel al lado derecho de los resultados de búsqueda en una ventana de navegador web estándar, los resultados del Gráfico de conocimiento aparecerán en paneles al lado de los resultados de búsqueda. No todos los términos de búsqueda generarán paneles del Gráfico de conocimiento: las consultas deberán coincidir con objetos bien definidos en el Gráfico de conocimiento. (No se preocupe si aún no ve los resultados del Gráfico de conocimiento; Google todavía está implementando la función y en este momento está limitada a usuarios de habla inglesa en los Estados Unidos).

Los paneles del Gráfico de conocimiento buscan mostrar un resumen de la información clave y más buscada sobre una consulta. sin necesidad de que los usuarios lean resúmenes de dos líneas de una página web o hagan clic en otra sitio. Para una persona, estos datos clave pueden incluir fechas de nacimiento y muerte, personas importantes asociadas con ella y puntos destacados breves de títulos, logros o qué más hace que esa persona sea importante. Para otras entidades, Google intentará mostrar información, estadísticas y asociaciones clave. El panel Gráfico de conocimiento también se encargará de la desambiguación. Si más de una entidad del Gráfico de conocimiento coincide con una consulta de búsqueda, Google proporciona acceso a todas ellas.

Quizás lo más significativo es que una vez que los usuarios interactúan con una entidad de Knowledge Graph pueden, dentro de algunos límites, navegar por los enlaces de relaciones con esas entidades. Por ejemplo, abrir una entrada del Gráfico de conocimiento sobre Dashiell Hammett debería permitir a los usuarios saltar inmediatamente a un resumen del Gráfico de conocimiento de El hombre delgado y El halcón maltés – y quizás a resúmenes sobre Lillian Helman y la caza de brujas anticomunista posterior a la Segunda Guerra Mundial.

Knowledge Graph no se limitará a búsquedas basadas en navegador: Google está implementando actualmente resultados de búsqueda de Knowledge Graph a la mayoría de los dispositivos que ejecutan Android 2.2 o superior (nuevamente, solo en inglés en EE. UU.) en el cuadro de búsqueda rápida y basado en navegador buscadores. Los resultados de búsqueda de Knowledge Graph también se introducirán en las próximas versiones de la aplicación de búsqueda de Google para dispositivos iOS. Los usuarios pueden navegar por la información en Knowledge Graph tocando o deslizándose hacia adelante y hacia atrás a través del contenido.

Gráfico de conocimiento de Google (móvil)

Es importante tener en cuenta que estos son solo los primeros lugares en los que aparece Knowledge Graph en los servicios de Google. Detrás de escena, puede esperar que los resultados de búsqueda de Knowledge Graph comiencen a informar una amplia variedad de servicios de Google, particularmente a medida que crece su corpus de conjuntos de datos y "hechos". Las búsquedas en Knowledge Graph probablemente nunca reemplazar La búsqueda tradicional basada en palabras clave de Google (la búsqueda semántica y la búsqueda literal son dos herramientas diferentes que sirven para dos tareas distintas). pero, en teoría, no sería sorprendente que Knowledge Graph algún día contribuyera a hasta una cuarta parte de las interacciones de Google con la búsqueda. usuarios.

¿Crowdsourcing… o clases del color de Google?

Entonces, ¿cómo selecciona Knowledge Graph información para sus resúmenes? Hasta ahora, Google no ha sido muy explícito sobre la metodología detrás de la presentación de Knowledge Graph. En mi (limitado) muestreo, una buena parte de los datos que Google prioriza para sus resúmenes parecen ser bastante consistentes: fechas, relaciones, y un único campo de "logro significativo" para las personas (que podría etiquetarse como "Descubrimientos" u "Ocupación" o "Título"). Los lugares obtienen ubicaciones y fechas, y una selección de otros campos que podrían ser exactamente lo que alguien quiere o completamente inapropiados. Por ejemplo, si está mirando el Empire State Building, proporcionar la dirección parece apropiado... pero no es tan apropiado para, digamos, Stonehenge. Pueden ocurrir rarezas similares con los números de teléfono: ¿cuántas personas necesitan acceso instantáneo a un número de teléfono para el Taj Mahal?

Gráfico de conocimiento de Google (Taj Mahal)

Google dice que prioriza la información que presenta en los resúmenes de Knowledge Graph utilizando "sabiduría humana". Y por eso Google no En realidad significa cosas que los humanos les dicen o que los expertos en la materia o los curadores de bases de datos recopilan; significa hacer suposiciones indirectas. sobre las intenciones de los usuarios registrando los comportamientos de búsqueda y controlando lo que hacen clic, lo que no hacen clic y lo que buscan después de realizar una búsqueda. buscar. En pocas palabras, Google está utilizando el crowdsourcing para intentar determinar qué "hechos" son los mejores para presentar en un resumen del Gráfico de conocimiento.

Por ejemplo, Google dice que la información resumida del Gráfico de conocimiento que presenta sobre Tom Cruise responde al 37 por ciento de las consultas de seguimiento de los usuarios de búsqueda de Google sobre el actor cuando lo buscan. Ese número del 37 por ciento suena tranquilizadoramente científico y preciso, pero no hay absolutamente ninguna manera de evaluarlo. si la evaluación de Google del comportamiento agregado de los usuarios de búsqueda tiene algo que ver con lo que hace un usuario en particular: como tú - quiere saber. Dado que Google parece tan orgulloso de esa cifra del 37 por ciento, volvamos la cuestión: Google dice 63 por ciento. Por ciento de las veces, no puede presentar ninguna información sobre un tema que sus usuarios de búsqueda encuentran. importante.

La posición de Google es fácil de entender: siempre que sea posible, quiere presentar inmediatamente la información que buscan sus usuarios. La única forma en que Google realmente puede evaluar esto es observando cómo la gente usa su motor de búsqueda e intentando hacer algunas conjeturas.

El crowdsourcing tiene sus peligros. Así como Google camina en aguas turbias cuando decide hacerlo priorizar los resultados de búsqueda de Google+ En Search Plus Your World, existen riesgos al depender del crowdsourcing para priorizar la presentación de información y “hechos”. Justo El hecho de que la audiencia de búsqueda de Google pueda no conocer (o no interesarse particularmente) cierta información no significa que no sea importante o importante. Hay muchos casos en los que la percepción de los hechos por parte de “la multitud” es errónea. La mayoría de la gente piensa que la esquizofrenia significa tener múltiples personalidades, beber leche o comer helado. aumenta la producción de moco, y María Antonieta dijo: “Que coman pastel”. Sin embargo, ninguna de estas cosas es verdadero.

Depender del crowdsourcing para evaluar la importancia de la información también crea posibilidades de abuso. ¿Supongamos que un gobierno quisiera sembrar información errónea sobre los disidentes, una campaña política quisiera difamar a un oponente o los piratas informáticos quisieran jugar con los resultados de búsqueda solo para reírse? De la misma manera que los resultados de búsqueda de Google han sido "Google bombardeado”, el crowdsourcing podría usarse para manipular Knowledge Graph. Las personas sensatas no creerán todo lo que leen; de manera similar, los “hechos” presentados por los motores de búsqueda semántica no serán confiables y, en algunos casos, el crowdsourcing hará que lo sean aún menos.

Hacer que Google sea más atractivo

En el aspecto práctico, el Gráfico de conocimiento de Google tendrá un impacto inmediato: hará que los resultados de búsqueda de Google sean más atractivos. Siempre que Knowledge Graph pueda proporcionar una respuesta directa a la pregunta de un usuario de búsqueda, o permitirle navegar rápidamente a través de temas relacionados, los usuarios permanecerán en los servicios de Google. Eso significa que Google recopila más datos sobre las búsquedas y el comportamiento de los usuarios (independientemente de si han iniciado sesión en una cuenta de Google o no). Esto, a su vez, permite a Google perfeccionar aún más su plataforma de publicidad dirigida.

También significa que servicios como Wikipedia, que a menudo responden al mismo tipo de preguntas sobre conocimientos específicos Las consultas dirigidas por Knowledge Graph verán una disminución en la cantidad de tráfico web que reciben de Google. En el caso de Wikipedia, eso corresponde directamente a menos oportunidades para solicitar el apoyo de la comunidad; para otros servicios, eso se traducirá directamente en una menor cantidad de impresiones de anuncios y (por lo tanto) menores ingresos. Para personas que ofrecen sitios y servicios basados en proporcionar datos e información discretos, y eso incluye todo, desde Wikipedia hasta IMDb y minoristas en línea. desde guías telefónicas y directorios de empresas hasta (posiblemente) servicios de colaboración colectiva como Yelp e incluso registros públicos... Knowledge Graph podría erosionar lentamente su negocios.

Recomendaciones de los editores

Cómo utilizar Google SGE: pruebe usted mismo la experiencia generativa de búsqueda
No es necesario utilizar Bing: la Búsqueda de Google ahora también tiene IA
Cómo ChatGPT podría ayudar a Microsoft a destronar la Búsqueda de Google
Google Chrome obtiene una de las mejores funciones de Microsoft Edge
La nueva herramienta de privacidad de Google te permite saber si se filtró tu información personal

Inside Knowledge Graph: la búsqueda semántica profunda de Google

Gráfico de conocimiento debajo del capó

Gráfico de conocimiento en la pantalla

¿Crowdsourcing… o clases del color de Google?

Hacer que Google sea más atractivo

Recomendaciones de los editores

Categorías

Reciente

El productor de 'Unsolved' trabajó para humanizar a las leyendas del rap Biggie y 2Pac

La música de The Glitch Mob es tan compleja que actúan en una nave espacial

Jimmy O. Yang habla de reemplazar a Erlich, siendo el Urkel de 'Silicon Valley'