Conversa Wikipedia:AutoWikiBrowser

Último comentario: Elisardojm hai 6 anos no fío "Como tratar tódolos artigos da wiki"

Como tratar tódolos artigos da wiki

editar

Para conseguir unha lista con tódolos artigos da Galipedia sen redireccións non atopei unha forma sinxela, haberá que ir investigando. Por certo, antes de meterse nisto, hai que ter en conta que hai que cargar no AWB o plugin NoLimitsPlugin porque se non, o programa non deixa facer listas de máis de 25.000 artigos. Para cargar ese plugin, o que hai que facer é ir á carpeta de Plugins do sitio onde está instalado o programa, ir á súa subcarpeta, e o ficheiro ".dll" que se atopa alí, copialo na carpeta onde está o ficheiro AutoWikiBrowser.exe.

Algunhas posibilidades para conseguir a lista de tódolos artigos son as seguintes:

  • Facer unha lista dos artigos que teñan un modelo moi usado. O Modelo:Control de autoridades está na maioría dos artigos, pero aínda hai bastantes que non o teñen, pero se xuntamos eses cos que teñen o Módulo:Navbar‏‎, e logo quitamos os repetidos, seguramente conseguiremos unha lista con tódolos artigos da Galipedia.
  • Usar un volcado da Galipedia. Nesta páxina tedes os últimos volcados da Galipedia, escolledes o último e buscades o ficheiro "List of page titles in main namespace". Tedes que descargar o ficheiro e descomprimilo, logo no AWB tedes que facer unha lista escollendo "Text file (UTF-8)", darlle a "Make list" e logo xa vos pide a dirección do ficheiro, logo só hai que escollelo e darlle a aceptar. Isto fai unha lista de tódolos artigos da Galipedia incluíndo as redireccións, se queredes quitar as redireccións podedes facer unha pre-análise da lista para que elimine eses artigos, agora non o podo explicar máis en detalle porque teño o bot a traballar e non quero paralo para que non se perda, outro día explico esta parte con máis detalle.
  • Usar un ficheiro xerado por un usuario. O usuario Edgars2007, de en.wiki, creou un ficheiro con data de 14-07-2018 que ten tódolos artigos de gl.wiki, está aquí, pode contactarse con el para conseguir ficheiros máis actualizados pero non sei cando se cansará de facelo. Non me explicou como o fixo.

Hai algunha forma máis, seguirei investigando para ver cal pode ser a forma máis doada de conseguir esta lista. Saúdos, --Elisardojm (conversa) 15 de xullo de 2018 ás 09:27 (UTC)Responder

Na en.wiki dixéronme como facer unha lista con tódolos artigos que non teñen o modelo de control de autoridade, así que si xuntamos esa lista coa de tódolos artigos que teñen ese modelo, e cos que teñen o módulo Navbar, e despois quitamos os repetidos, conseguiremos unha lista completa, ou case completa, de tódolos artigos da wiki. A lista pódese obter nesta ligazón, hai que descargar o ficheiro en formato CSV, que é como se fose formato texto, e logo esa lista cargala no AWB. Por se no futuro desaparecese esa consulta, copio aquí como sería, esta consulta habería que metela na ferramenta de consultas da wiki Quarry:
use glwiki_p;
Select page_title
from page where page_namespace=0
and page_is_redirect=0
and page_id not in (select tl.tl_from from templatelinks tl
				  	   where tl.tl_title="Control_de_autoridades" and tl.tl_namespace=10 and tl.tl_from_namespace=0)
Outro día fago unha proba e xa poño aquí os pasos polo miúdo. Saúdos, Elisardojm (conversa) 16 de xullo de 2018 ás 10:11 (UTC)Responder
Volver á páxina do proxecto "AutoWikiBrowser".