Web archives as research infrastructure for digital societies: the case study of Arquivo.pt


Gomes Daniel1ORCID


1. The Foundation for Science and Technology (Portugal)


Archiwum internetu jako infrastruktura badawcza społeczeństwa cyfrowego: studium przypadku Arquivo.pt Ludzkość jest dominującym gatunkiem na Ziemi. nasza przewaga ma źródło w unikalnej zdolności organizowania się na dużą skalę dla osiągnięcia wspólnych celów. W społeczeństwie cyfrowym wszelka organizacja wymaga przekazywania informacji, a współcześnie jej większość jest publikowana wyłącznie online. Problem stanowi to, iż informacja online znika bardzo szybko, już po kilku miesiącach. Zależność ludzkości od informacji online jest bardzo duża i wciąż aktualna, a konsekwencje utraty perspektywy historycznej w odniesieniu do danych online nie zostały dotąd zbadane. Archiwa internetowe są cyfrowymi systemami przechowywania, które gromadzą, zachowują i udostępniają historyczne dane stron internetowych. Są one używane przez badaczy. Jednakże archiwa internetowe, aby służyć społeczeństwu cyfrowemu, powinny być także wykorzystywane przez szerszy krąg użytkowników. Arquivo.pt jest publicznym archiwum internetowym, uruchomionym w 2007 r., które umożliwia prowadzenie badań i dostęp do danych historycznych stron internetowych, zachowanych od lat dziewięćdziesiątych XX w. W artykule zaprezentowano portal Arquivo.pt jako studium przypadku dotyczące infrastruktury badawczej rozwijanej do obsługi szerokiego grona użytkowników na poziomie krajowym i międzynarodowym. Artykuł prezentuje najważniejsze wnioski mogące przysłużyć się powstawaniu i szybszemu rozwojowi innych inicjatyw archiwizacji Internetu. Opisuje także istniejące narzędzia i podejścia umożliwiające badanie historycznych zbiorów internetowych. Wreszcie, prezentuje wyzwania wiążące się z tworzeniem archiwów internetowych oraz propozycje działań w tym zakresie. Humans are the dominant species on Earth. Our advantage comes from our unique capacity of organising at large scale to reach common goals. In digital societies, organising requires communicating information and these days, most of it is published exclusively online. The problem is that online information disappears quickly, after a few months. Humanity’s dependence on online information is strong but still recent and the consequences of losing the historical perspective over online data are yet to be seen. Web archives are digital preservation systems that collect, store and provide access to historical web data. Scientific researchers have been using web archives. However, web archives should also be used by the wider public so that they may serve digital societies. Arquivo.pt is a public web archive started in 2007 that enables search and access to historical information preserved from the Web since the 1990s. This article presents Arquivo. pt as a case study for a research infrastructure that has been developed to serve wider communities at national and international levels. The article shares the main lessons learned so that other web archiving initiatives may arise and be developed at a faster pace. It describes the existing tools and activities which enable exploration of historical web-archived collections. Finally, it presents challenges related to creating web archives and proposes actions to address them.


