{"id":11871,"date":"2009-04-17T10:41:10","date_gmt":"2009-04-17T08:41:10","guid":{"rendered":"http:\/\/www.ojobuscador.com\/?p=11870"},"modified":"2009-04-17T10:41:10","modified_gmt":"2009-04-17T08:41:10","slug":"fows09-external-mining-of-search-query-logs","status":"publish","type":"post","link":"https:\/\/www.ojo.es\/ojobuscador\/fows09-external-mining-of-search-query-logs\/","title":{"rendered":"FOWS09: External mining of search query logs"},"content":{"rendered":"<p><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/www.ojo.es\/ojobuscador\/wp-content\/uploads\/sites\/2\/2019\/05\/ziv-bar-yossef.jpg\" alt=\"Ziv Bar-Yossef\" title=\"Ziv Bar-Yossef\" width=\"200\" height=\"280\" class=\"alignright size-full wp-image-11886\" \/>La primera de las Keynotes del d\u00eda la est\u00e1 realizando Ziv Bar-Yossef, de Google Haifa (Israel).<\/p>\n<p>Los logs son algo bastante complejo para utilizar, por lo que tal vez no sea interesante investigar en los propios logs sino realizar una serie de consultas a los resultados de b\u00fasqueda.<\/p>\n<p>El principal de los costes se calcula en base a la cantidad de consultas que se realizan en los servicios de b\u00fasqueda.<\/p>\n<p>\u00c2\u00bfPor que realizar \u00abexternal mining\u00bb?<\/p>\n<ul>\n<li>Lo puede realizar cualquiera<\/li>\n<li>No hay restricciones, s\u00f3lo limitadas a la interfaz de los propios buscadores<\/li>\n<li>Puede ser aplicado a los diferentes buscadores<\/li>\n<\/ul>\n<p>Eso s\u00ed&#8230; \u00c2\u00bfesto es fiable? \u00c2\u00bfes eficiante?<\/p>\n<p>El estudio realizando en los \u00faltimos 2 a\u00f1os se basa en saber si son fiables y eficientes esta forma de extracci\u00f3n de datos.<\/p>\n<p>Un detalle que hay que investigar es la cantidad de consultas que se realizan para unas palabras, si disponen de alguna relaci\u00f3n con campa\u00f1as publicitarias y el inter\u00e9s de la consulta (por ejemplo para <a href=\"https:\/\/trends.google.com\/trends\/\">Google Trends<\/a>).<\/p>\n<p>Para estimar los rankings, se puede estudiar cuantas veces aparece un documento (sitio web) en el TOP 10 de los resultados de b\u00fasqueda en una cantidad espec\u00edfica de tiempo. Con esto podemos tener informaci\u00f3n para herramientas como <a href=\"https:\/\/trends.google.com\/trends\/\">Google Trends for Websites<\/a> o para Anal\u00edtica Web.<\/p>\n<p>Otro elemento a investigar son las palabras por las que aparecen esos sitios web. Con esto se puede investigar y extraer informaci\u00f3n para los \u00absuggest\u00bb y anuncios y para encontrar sitios relacionados.<\/p>\n<p>La informaci\u00f3n se puede tomar en base a la uniformidad y popularidad, adem\u00e1s de sacar el <em>ImpressionRank<\/em> (que vendr\u00eda a ser un ranking basado en las veces que aparece el sitio en los resultados de b\u00fasqueda). Con esto podemos llegar a sacar un sistema de evaluzaci\u00f3n de los resultados de b\u00fasqueda, adem\u00e1s de sacar un modelo de b\u00fasquedas informacionales, navigacionales, transacionales, comerciales o geolocalizadas.<\/p>\n<p>Hoy en d\u00eda la mayor\u00eda de los grandes buscadores ofrecen un sistema de sugerencias de b\u00fasquedas. Est\u00e1n basados en los \u00abquery logs\u00bb, ordenadas por popularidad, an\u00f3nimas y las \u00abbad-queries\u00bb est\u00e1n filtradas.<\/p>\n<p>Cuando el servidor de sugerencias recibe una consulta, encuentra el top sugerencias para esa consulta. S\u00f3lo se devuelve el TOP10 de esa consulta. Para calcular la fuerza de la estimaci\u00f3n necesitamos una mezcla entre la informaci\u00f3n de la popularidad de la consulta junto a su ranking.<\/p>\n<p>Los resultados de los sistemas de sugerencias podr\u00edan basarse en la popularidad o, por ejemplo en un sistema basado en un c\u00e1lculo del volumen de b\u00fasquedas.<\/p>\n<p>En resumen, podemos definir que hay 4 algorimos de miner\u00eda:<\/p>\n<p class=\"aligncenter\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/www.ojo.es\/ojobuscador\/wp-content\/uploads\/sites\/2\/2019\/05\/1conclusiones.png\" alt=\"Conclusiones\" title=\"Conclusiones\" width=\"650\" height=\"445\" class=\"aligncenter size-full wp-image-11872\" \/><\/p>\n","protected":false},"excerpt":{"rendered":"<p>La primera de las Keynotes del d\u00eda la est\u00e1 realizando Ziv Bar-Yossef, de Google Haifa (Israel). Los logs son algo bastante complejo para utilizar, por lo que tal vez no sea interesante investigar en los propios logs sino realizar una serie de consultas a los resultados de b\u00fasqueda. El principal de los costes se calcula &#8230; <a title=\"FOWS09: External mining of search query logs\" class=\"read-more\" href=\"https:\/\/www.ojo.es\/ojobuscador\/fows09-external-mining-of-search-query-logs\/\" aria-label=\"Leer m\u00e1s sobre FOWS09: External mining of search query logs\">Leer m\u00e1s<\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"class_list":["post-11871","post","type-post","status-publish","format-standard","hentry","category-noticias"],"_links":{"self":[{"href":"https:\/\/www.ojo.es\/ojobuscador\/wp-json\/wp\/v2\/posts\/11871","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.ojo.es\/ojobuscador\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.ojo.es\/ojobuscador\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.ojo.es\/ojobuscador\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.ojo.es\/ojobuscador\/wp-json\/wp\/v2\/comments?post=11871"}],"version-history":[{"count":0,"href":"https:\/\/www.ojo.es\/ojobuscador\/wp-json\/wp\/v2\/posts\/11871\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.ojo.es\/ojobuscador\/wp-json\/wp\/v2\/media?parent=11871"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.ojo.es\/ojobuscador\/wp-json\/wp\/v2\/categories?post=11871"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.ojo.es\/ojobuscador\/wp-json\/wp\/v2\/tags?post=11871"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}