Cómo buscar y descargar archivos impopulares y viejos en Internet

Mayormente archivos de medios. Totalmente legítimo, no es broma.

Como a veces sucede, desea descargar un álbum de música de 2007, del artista conocido por 3.5 personas, como un Ska-punk español o un speedcore europeo menos conocido. Tengo un archivo torrent, lo importo al cliente, descargo rápidamente hasta el 14.7% y … eso es todo. El día, la semana pasa, pero el porcentaje de datos descargados no aumenta. Está buscando ese álbum en el motor de búsqueda, se topa con foros con enlaces solo para usuarios registrados con "mensajes útiles", se registra allí, inunda rápidamente 5 mensajes en temas antiguos y finalmente obtiene enlaces para sitios de intercambio de archivos como rapidshare y megaupload, que están cientos de años muertos a partir de ahora.

Lamentablemente, es una situación muy común cuando intentas descargar algo viejo.

Eso pasa. Últimamente, desafortunadamente, sucede cada vez más a menudo: los titulares de derechos de autor y las autoridades policiales se han tomado en serio el intercambio de archivos; el año pasado vimos KickassTorrents cerrados o incautados, BlackCat Games, what.cd, btdigg, torrentzeu, EX.ua, fs.to, torrents.net.ua y todos los demás sitios web. Aunque es probable que no enfrente grandes problemas para encontrar películas recientes y series de TV / animadas incluso a pesar de la repetida eliminación de contenido de los motores de búsqueda, los rastreadores de torrents y el uso compartido de archivos, la búsqueda de la fuente de películas (DVD o Blu-Ray) o simplemente Los rasgadors de TV de 7 años que no son ingleses y no rusos pueden ser un reto.

¿Por qué necesitarías eso alguna vez?

  • La falta de lanzamientos de DVD para algunas series
    La película podría haber sido doblada y transmitida por televisión en algún país, pero nunca en DVD. Los cappers lo rompen y lo cargan en sitios para compartir archivos o a través de Bittorrent, luego el DVD se lanza en otro país sin audio doblado, por ejemplo, uno francés. Las personas se ven obligadas a descargar DVDRip de alta calidad sin copia francesa o una extracción de TV de calidad relativamente baja.
    A medida que pasan los tiempos, cada vez menos personas descargan TVRip francés, se eliminó de los sitios de intercambio de archivos debido a la inactividad del archivo. La descarga de este lanzamiento se convierte en una tarea bastante trivial.
    Uno puede resolver el problema mutando el audio de la extracción de TV a DVD, pero nadie lo hizo y la versión de TV murió.
  • Diferentes contenidos de TV y DVD
    Por ejemplo, Daria perdió casi toda la música de la versión de TV debido a problemas legales con la nueva licencia para DVD. Durante mucho tiempo, las personas tuvieron que elegir entre ver la versión completa con toda la música y la mala calidad de video, o una versión agradable en DVD, pero sin música.
  • Diferencia regional
    Esto es cierto tanto para video como para música. La serie WITCH se emitió con 4 aperturas diferentes, de las cuales solo una entró al DVD.
    Las versiones japonesas de los álbumes de música son conocidas por pistas adicionales, que faltan en cualquier otra edición.

Como ya puede comprender, todos tienen una razón propia. ¿Dónde descargamos archivos impopulares y antiguos?

Usenet

Usenet es una red distribuida de servidores que sincroniza los datos entre ellos. La estructura de Usenet se asemeja a algo en el medio entre los foros y el correo electrónico: los denominados "grupos de noticias" (categorías de Usenet) tienen una estructura de árbol. Los usuarios de Usenet pueden unirse a grupos, leer y escribir en él. Al igual que en el correo electrónico, los mensajes de Usenet tienen tema, lo que ayuda a organizar el tema de discusión.
Hoy en día Usenet se usa principalmente para compartir archivos.

Historial de Usenet

Surgida en 1979, la red usó conexiones directas de módem para transferir información usando UUCP y generalmente fue un instrumento para comunicaciones de texto. Esa vez Usenet era un competidor de BBS; había entradas especiales entre Usenet y Fidonet.
A medida que Internet llega, la mensajería Usenet cambia a pila TCP / IP, usando NNTP, que aún se usa incluso fuera de Usenet (por ejemplo, puede leer muchas listas de correo público usando gmane y RSS a través de gwene, y a diferencia de la lista de correo habitual, siempre puedes volver a la historia antes de suscribirte a esa lista).

Con más velocidad de línea, módems modernos y sus protocolos, a principios de los 90, Usenet se convirtió en un terreno para las transferencias de archivos: warez, música, videos. El algoritmo es similar a uno en Correo electrónico: el archivo se corta en varias partes (volúmenes), se codifica utilizando caracteres imprimibles en una codificación de 7 bytes con Base64 o uuencode, y se envía al grupo de noticias.
La codificación de 7 bits agrega aproximadamente un 30% de sobrecarga de transferencia de archivos. La especificación de Usenet permitía usar la mayoría de los símbolos ASCII, no solo los imprimibles, por lo tanto, el nuevo algoritmo de codificación de archivos yEnc surgió en 2001, agregando solo el 1-2% de la sobrecarga. Cita solo símbolos de nueva línea, bytes NULL e igual signo (=). yEnc sigue siendo el algoritmo principal de las transferencias de archivos de Usenet.

Comprobación de integridad y recuperación de volumen dañado se logra con Parchive

Antes de 2008, los grandes proveedores de Usenet almacenaban archivos binarios por solo 100-150 días ("tiempo de retención"). Desde 2008, los proveedores más importantes dejaron de borrar todo y almacenar archivos para siempre, por lo que uno puede descargar archivos de 8 años sin ningún problema, mientras que los proveedores de tamaño medio almacenan archivos durante más de 1000 días, lo que no es exactamente malo también. Hoy en día, la comunicación de texto a través de Usenet es casi inexistente; la red se usa principalmente como almacenamiento de archivos.

Alrededor de mediados de 2001, la red fue detectada por titulares de derechos de autor, lo que obligó a los proveedores de Usenet a eliminar contenido protegido por derechos de autor, lo que influyó en gran medida en la coherencia de las versiones. Algunos proveedores crearon sistemas automáticos para eliminar archivos protegidos por derechos de autor, lo que permite a los titulares de derechos de autor eliminar información por sí mismos. Para detener o, al menos, desacelerar la eliminación de archivos, los entusiastas comienzan a cargar archivos con nombres de archivo ofuscados o a usar archivos protegidos con contraseña, y luego los agregan a sitios web privados con índices de archivos de solo invitación. Estas versiones no se pueden encontrar ni descargar por los medios habituales.

En la Rusia moderna, Usenet es conocido solo por unas pocas personas, a pesar de que fue uno de los dos vínculos de trabajo con Occidente en el golpe de 1991 (el segundo es Fido).
En la actualidad, Usenet es más popular en países con estrictas leyes de derechos de autor con multas por descargar o cargar contenido protegido por derechos de autor. Alemania es un ejemplo de ese país.
A diferencia de Bittorrent, no puede determinar la dirección IP de los usuarios en Usenet, a menos que sea en cooperación con ISP o el proveedor de Usenet.

Conéctese a Usenet

Lo más probable es que no pueda unirse a la red de forma gratuita: obtendrá un tiempo de retención bajo (10-30 días) o baja velocidad, o incluso acceso a grupos de noticias de solo texto. Debe comprar acceso de cualquier proveedor o revendedor de Usenet. La mayoría de los proveedores ofrecen dos tipos de acceso: suscripción mensual con datos no medidos (ilimitados) y plan de datos sin límite de tiempo (bloque). Si está interesado en descargar archivos varias veces al mes, el acceso a bloques está listo.
Los proveedores más importantes son: Altopia , Giganews , Eweka , NewsHosting , Astraweb .

Ahora de alguna manera necesita obtener el archivo nzb con metainformación. Esto es algo así como un archivo .torrent para Usenet. Usemos el motor de búsqueda indexador si no tiene uno.

Indizadores

Los indexadores públicos están llenos de spam y virus, sus capacidades de búsqueda son mediocres, pero, sin embargo, son buenos para archivos viejos cargados hace 5 años o más.

Éstos son algunos de ellos:

Los indexadores gratuitos con requisitos de registro son más adecuados para archivos nuevos. Su estructura de catálogo es buena, las versiones no solo tienen el nombre, sino también la descripción y la imagen.

Recomiendo especialmente los dos últimos, son capaces de buscar versiones ofuscadas.
Hay índices enfocados solo en un tema, por ejemplo, anizb para anime y albumsindex para música.

Descarga desde Usenet

Tratemos de descargar The FP , una película impopular y casi desconocida de 2011, cuyo BDRip de 1080p no se puede encontrar en el internet habitual.
Necesita encontrar el archivo nzb e importarlo en el programa de descarga como NZBGet o SABnzbd .

Vaya a nzbking.com , busque "the.fp.2011".

Este archivo tiene solo 1 parte de 3867. No puede descargar dicho archivo, el indexador lo muestra en rojo.

Los archivos protegidos con contraseña generalmente son falsos.

La segunda página nos muestra un signo de DVDRip adecuado: el tamaño del archivo es bueno, sin contraseña.

La tercera página nos muestra BDRip y varios DVDRips, que se ven bien (según el tamaño del archivo y la fecha de carga).

Elija los archivos que desea descargar, presione "Descargar NZB", importe .nzb en NZBGet o SABnzbd con los datos configurados de la cuenta de Usenet.
El archivo se está descargando con la velocidad de enlace del ISP completa.

A medida que el archivo terminaba de descargarse, NZBGet descomprimía automáticamente los archivos y los eliminaba, manteniendo solo los datos desempaquetados. Tienes 6.74 de datos, que se cargaron hace 4.5 años, en solo 15 minutos, ¡hurra!

IRC / DCC / XDCC

Internet Relay Chat es un protocolo antiguo para las comunicaciones de texto que sigue siendo popular entre los desarrolladores de software de código abierto, los administradores de rastreadores de torrents, los amantes del anime y los autores de botnet CnC, debido a su simplicidad. Surgido en 1989, el IRC se convirtió rápidamente en el estándar para los chats de texto en Internet durante largos años, y concedió su popularidad a ICQ y Jabber solo a mediados de la década de 2000. IRC admite la transferencia de archivos utilizando DCC, que se usó por primera vez para el intercambio automático de archivos por Xabi, en Xabi DCC (de ahí el nombre – XDCC).

Ahora tiene canales IRC e incluso servidores enteros solo para transferencias de archivos usando XDCC. Casi cualquier grupo de lanzamiento de anime, a veces incluso sin un sitio web, tiene su propio bot, que sirve todos los archivos del grupo. La popularidad de XDCC se basa en la facilidad de uso y administración de bots de intercambio de archivos: el cargador solo necesita cargar el archivo usando FTP, por ejemplo, y bot lo agregará automáticamente al índice y notificará a los usuarios del canal (si se trata de un nuevo episodio de una serie de televisión como ejemplo).

Se utilizan redes IRC privadas especiales para warez, música fresca y no así, música, juegos, botas. XDCC apenas es conocido por las agencias de derechos de autor, es por eso que puedes encontrar muchas cosas que no puedes encontrar en otros lugares.

Indizadores

La mayoría (pero no todos) de los bots de XDCC están indexados con scripts especiales, proporcionando una interfaz web para el motor de búsqueda.

Indizadores de contenido genérico:

Indexadores de anime:

Cómo descargar desde IRC

Necesitarás un cliente de IRC. Casi cualquier cliente funcionará, la abrumadora mayoría de los clientes respaldan a DCC. Únase al servidor según el contenido que le interese y descárguelo.
Los servidores más grandes con libros :

  • irc.undernet.org, #bookz room
  • irc.irchighway.net, #ebooks room

Warez :

  • irc.criten.net, sala #elitewarez
  • irc.infatech.net, sala #elitewarez
  • irc.scenep2p.net, # the.source room

Películas :

  • irc.abjects.net, sala #moviegods
  • irc.abjects.net, # beast-xdcc room

Animación occidental y japonesa :

  • irc.rizon.net, #news room
  • irc.xertion.org, # cartoon-world room

Todos los robots aceptan !find o @find comandos para buscar archivos, el envío de resultados con un mensaje directo busca. La búsqueda de una consulta popular te hará literalmente spam con los resultados de búsqueda, por eso es sensato usar el comando @search donde esté disponible. Este comando activará un bot de indexador especial para enviarle resultados de búsqueda en un archivo a través de DCC.

Tratemos de descargar "Cómo se liberó la música", un excelente libro sobre la industria de la música, las tecnologías para compartir música y una persona que robó casi 2000 álbumes diferentes y lo subió a Internet.

El bot reacciona a la solicitud @search y envía los resultados en un archivo de texto comprimido a través de DCC.

Enviemos la consulta de solicitud de descarga al bot.

¡Y acéptalo!

Si encontró un archivo usando el indexador de archivos, no necesita buscarlo en el canal. Simplemente envíe la consulta de descarga al bot de inmediato utilizando el comando del sitio del indexador.

DC ++

La red de Direct Connect se basa en la arquitectura cliente-servidor, donde todas las comunicaciones que no comparten archivos se realizan a través del servidor, que se denomina hub. DC ++ admite compartir los directorios completos, puede buscar los tipos de archivos exactos (audio, video, archivos, documentos, imágenes de disco) y tiene un motor de búsqueda que no está vinculado al nombre del archivo. DC ++ es más conocido por el chat integrado, que fue muy útil en las redes locales de los primeros días.
Dichos centros fueron populares en Rusia, algunos de ellos fueron mantenidos por los propios ISP. El ISP siberiano "GoodLine" publicitó su propio hub DC ++ en vallas publicitarias e incluso tenía un software especial dentro de decodificadores para entregar a los usuarios nuevas películas directamente en el televisor.
Ese fue el centro más grande del mundo, con más de 100000 usuarios.

Debido a la facilidad para compartir archivos (solo necesita poner un tic en el directorio para compartir), puede encontrar basura extraña y exótica, que, como el usuario piensa, nadie recuerda, pero aún la comparte con otros, solo en caso.

El videotutorial de 11 años es sembrado por 3 personas. Nadie querría verlo, créeme.

Cómo descargar desde DC ++

Necesitará cualquier cliente DC ++. FlylinkDC ++ es bueno para Windows (también es compatible con Bittorrent). Los usuarios de Linux eligen EiskaltDC ++ o AirDC ++ Web .

Únase a algunos hubs de DC ++, cuantos más mejor. La lista concentrada de DC ++ está disponible en los clientes, pero también puede acceder a ella utilizando esta página web especial y copiando la dirección desde allí.

Le recomiendo que configure el "Modo activo" y configure el reenvío de puertos; de lo contrario, no podrá descargar archivos de los usuarios en "Modo pasivo" y sus resultados de búsqueda serán limitados.

La búsqueda y la descarga se explican por sí mismas: escriba la consulta de búsqueda, elija el tipo de contenido si lo desea, presione "buscar", haga doble clic en el resultado de la búsqueda para descargar. También puede ver una lista de todos los archivos compartidos del usuario exacto (y descargar todos los archivos de la carpeta seleccionada) haciendo clic con el botón derecho en el resultado de la búsqueda y seleccionando el elemento de menú correspondiente.

Si el archivo que estaba buscando no se encuentra, vale la pena repetir la consulta de búsqueda de vez en cuando. Las personas tienden a iniciar el cliente de DC solo cuando necesitan descargar algo, por lo que debe atrapar la ola para encontrar archivos de dichos usuarios.

La búsqueda simultánea de archivos múltiples puede ser difícil debido a las limitaciones del protocolo NMDC. Los resultados de búsqueda pueden entremezclarse y mostrarse para diferentes consultas de búsqueda, por eso es más seguro realizar solo una búsqueda a la vez. Los hubs ADC no tienen tal limitación, pero son tristemente inexistentes (su URI comienza con adc:// , no con dchub:// ).

Indizadores

La búsqueda integrada encuentra los archivos solo en listas de usuarios en línea, por eso los indexadores son muy útiles para buscar archivos raros.

Hasta donde yo sé, el único indexador de DC ++ es spacelib.dlinkddns.com (y su otra dirección es dcpoisk.no-ip.org ). La búsqueda se basa en el motor Sphinx con soporte de morfología. Los resultados de búsqueda consisten en enlaces magnet que puede agregar a la cola de descarga en el cliente DC ++.
A veces está mal por mucho tiempo. Por ejemplo, la última vez fue durante 2 meses seguidos.

eDonkey2000 (ed2k), Kad

ed2k es un protocolo de transferencia de archivos descentralizada con concentrador centralizado para consultas de búsqueda y que establece conexión entre usuarios, al igual que DC ++. Itr solía ser el protocolo n. ° 1 para el intercambio de archivos para todos los grupos sociales antes de la incautación del servidor más popular, Razorback 2, en 2006, y la creciente popularidad de BitTorrent.

eDonkey 2000 todavía está vivo. Simplemente debido al protocolo descentralizado de Kad, que se implementó justo antes de que Razorback 2 y el servidor cliente original dejaran de estar en servicio.

Puede encontrar casi el mismo contenido que en DC ++: viejas series de televisión con diferentes doblajes, varias músicas, juegos, warez, viejos libros de programación, libros de matemáticas y biología. Por supuesto, los nuevos lanzamientos están aquí también. El protocolo admite la funcionalidad de chat, pero es poco probable que pueda utilizarlo, ya que está deshabilitado de forma predeterminada en todos los clientes, sus mensajes simplemente no se mostrarán.

Cómo descargar desde eDonkey2000 / KAD

Como puedes adivinar, necesitarás el cliente de ed2k. aMule es una buena elección para Linux. Los usuarios de Windows probablemente deberían usar eMule , aunque no se actualiza desde 2011.
Se recomienda encarecidamente configurar el reenvío de puertos para poder descargar desde usuarios detrás de NAT (LowID).

El proceso de búsqueda y descarga es muy similar a uno en DC ++. Escriba la consulta de búsqueda, obtenga los resultados de los usuarios en línea, haga doble clic en el archivo para comenzar la descarga.
El resultado de la consulta se mostraría incluso si ninguno de los usuarios lo tiene completo, pero solo partes de él.

Encontremos " We Live In Public ", un documental menos conocido de 2009 sobre internet de los 90. Una parte de esta película cuenta sobre el servicio de transmisión de video pseudo.com desde 1993, que está previsto en parte como Internet moderno.

Simplemente escriba la consulta de búsqueda, presione el botón y espere los resultados:

Haga doble clic para comenzar la descarga.

Descargar un archivo puede llevar semanas o incluso meses. Por alguna razón desconocida, la mayoría de los usuarios de ed2k tienen una velocidad de internet desagradable y aparecen en la red solo por algunas horas a la semana, o incluso menos. Se paciente.

Soulseek

Soulseek es una red centralizada para compartir música p2p, creada en 2000 por uno de los desarrolladores de Napster. Es conocido en la comunidad de IDM, y todavía está en desarrollo activo. Los chats grupales y privados, el intercambio de archivos de solo amigo a amigo, la etiqueta y la búsqueda de bitrate son algunas de las otras cosas de esta red.
Algunas consultas de búsqueda están censuradas.

El SoulseekQt propietario oficial es el más popular, con dos clientes no oficiales también disponibles: Nicotine + y Museek + .

BitTorrent DHT

Todos los clientes modernos de BitTorrent pueden encontrar pares utilizando la tabla distribuida de hash (DHT). Esta característica es utilizada no solo por las compañías orientadas al derecho de autor para monitorear a los usuarios y enviarles mensajes de infracción de derechos de autor, sino también por indexadores DHT, para recibir un archivo torrent con información de la consulta DHT de terceros y guardarlo en la base de datos. Estos indexadores pueden ser útiles para encontrar torrents raros o inéditos por nombre de archivo o directorio, o para buscar torrents similares con potencialmente más semillas.

El indexador más conocido pero hoy en día muerto es btdigg , los otros sitios vinieron a reemplazarlo:

Los indexadores DHT son conocidos por vivir vidas cortas: dos de mis favoritos, fastbot y BTKitty.red, son inaccesibles cuando escribo este artículo.

Sitios para compartir archivos y servidores FTP

Casi todas las regiones tienen su propio sitio para compartir archivos, que es popular entre el grupo lingual exacto. Por ejemplo, puede encontrar muchos contenidos checos y eslovacos en uloz.to; zone-telechargement.ws es bueno para contenido francés, mientras que chomikuj.pl es para medios polacos.

Los indexadores de FTP no encuentran el archivo solicitado con tanta frecuencia, pero inténtelo de todos modos:

Los motores de búsqueda de sitios web para compartir archivos tampoco son tan efectivos, pero no los olvide:

Puede encontrar mucho contenido en ex.ua hasta hace muy poco, pero lamentablemente está cerrado ahora, qué lástima.

Cómo buscar lanzamientos de escena

No siempre es suficiente buscar solo el nombre del contenido, puedes dejar que las escenas se escapen entre tus dedos.

La escena Warez , a menudo denominada The Scene , es una comunidad clandestina de personas que se especializan en la distribución de material protegido por derechos de autor, incluidos programas de televisión y series, películas, música, videos musicales, juegos (todas las plataformas), aplicaciones (todas las plataformas) , libros electrónicos y pornografía. La escena está destinada a estar oculta al público, solo se comparte con aquellos dentro de la comunidad. Sin embargo, como los archivos se filtraron comúnmente fuera de la comunidad y su popularidad creció, algunos individuos de The Scene comenzaron a filtrar archivos y subirlos a archivos de archivos, torrents y ed2k.

https://en.wikipedia.org/wiki/Warez_scene

Los lanzamientos de escenas son conocidos por nombres breves o intencionalmente ilegibles para evitar que busque con los medios habituales por nombre de archivo. Para determinar el nombre propio, debe buscar el lanzamiento de la escena en un indexador de lanzamiento de escena especial: layer13.net , pre.corrupt-net.org y predb.me .

Vamos a determinar el nombre de la escena de We Live In Public de PUZZLE, usando Layer13:

El nombre de NFO es "puzzle-wlip.nfo". Los nombres de los archivos están en el 99% de los casos iguales al nombre de NFO, así que intentemos buscar "rompecabezas-wlip" en un indexador de Usenet:

¿Cómo podemos descargar una imagen de DVD, hurra!

Los motores de búsqueda habituales como Google no siempre son sus amigos útiles. En primer lugar, Google sigue la DMCA y elimina (oculta) el contenido restringido por derechos de autor. En segundo lugar, podría ser bastante trivial encontrar contenido con símbolos especiales: prueba buscar WITCH , y obtendrás los resultados de Witch , The Witch y Blair Witch .
Prefiero DuckDuckGo , Bing y el motor de búsqueda meta SearX : a veces encuentras materiales no disponibles en ningún otro lado.
Si está interesado en un lanzamiento del lenguaje exacto, es sensato buscar por nombre localizado que puede obtener de Wikipedia, IMDb u otros sitios web similares.

Los amores de Anime son libres de usar anidb, que almacena toda la información sobre todos los lanzamientos. La información del grupo generalmente contiene el enlace del sitio web o el canal IRC donde puede hablar con sus miembros y descargar archivos usando XDCC.

Además de la fuente, la resolución de video, el audio y el idioma de los subtítulos, anidb almacena el hash TTH para DC ++ y el enlace ed2k para eDonkey2000 de cada archivo conocido.

El fin

Así es como busco archivos en internet. Este artículo no contiene elementos obvios como ordenar discos de Amazon o Ebay o buscar en los rastreadores populares de Torrent. Todos los métodos descritos son buenos para el contenido de los medios europeos y estadounidenses, pero no tuve la oportunidad de buscar contenido árabe o indio, por lo que no puedo decir si sería efectivo o no en ese caso.