Partiendo de una lista de dominios .es que se ha incrementado en unos 50.000 con respecto a los del año pasado (un total de 1.854.501 han sido los rastreados en 2017), se ha ampliado el límite de megas a recolectar por dominio (de 100 a 150), la recolección ha durado dos meses (un mes menos que el año pasado) y el total de terabytes descargados supera en casi un 45% los del la pasada edición. Se han recolectado más de 655 millones de documentos de todo tipo y se han recolectado al completo más de un 88% de los dominios rastreados.

Las recolecciones masivas no pretenden ser exhaustivas ni por su alcance puede hacerse un control de calidad de todo lo recolectado. Su propósito es obtener una imagen amplia de la web española en un momento dado que sea lo más representativa posible de toda la información que se publica en la web española. Estas se complementan con las recolecciones selectivas que la BNE lleva a cabo en colaboración con los centros de conservación de las comunidades autónomas sobre distintos eventos, materias específicas o contenidos de interés en el ámbito autonómico.

El proyecto de archivado web de la BNE comenzó en 2009, cuando esta contrató con la entidad sin ánimo de lucro Internet Archive la primera recolección masiva del dominio .es. La colección de la web española que conserva la BNE alcanza ya los 220 Tb de información archivada. Próximamente se dará acceso a los usuarios a esta colección.