Dane badawcze

należy przez to rozumieć dane wytworzone lub zgromadzone w ramach działalności naukowej w rozumieniu art. 4 ustawy z dnia 20 lipca 2018 r. – Prawo o szkolnictwie wyższym i nauce (Dz.U. z 2024 r., poz. 1571 z późn. zm.), inne niż publikacje, utrwalone w formie elektronicznej lub nieelektronicznej, wykorzystywane jako dowody w procesie badawczym lub służące do weryfikacji poprawności ustaleń i wyników badań, na przykład: dokumenty, arkusze kalkulacyjne, kwestionariusze, nagrania audio/wideo, transkrypty, zdjęcia, bazy danych, modele, algorytmy, skrypty i oprogramowanie; (źródło definicji: Załącznik do Zarządzenia Nr 84/2025 Rektora PB) – Polityka Otwartego Dostępu w Politechnice Białostockiej).

Pra­cow­nicy i dok­to­ranci PB mogą depo­no­wać swoje dane badaw­cze w Bazie Wie­dzy PB. Są one udo­stęp­nia­nie na wybra­nej licencji Cre­ative Com­mons.

Na wniosek twórcy Ofi­cyna Wydaw­ni­cza Poli­tech­niki Bia­ło­stoc­kiej nadaje numer DOI danym badawczym.

Osoby, które chcą zde­po­no­wać dane badaw­cze zobo­wią­zane są do wypeł­nie­nia załącz­nika nr 4 do Zarzą­dze­nia Rek­tora Poli­tech­niki Bia­ło­stoc­kiej nr 53/2021 i dostar­cze­nia go do Oddziału Infor­ma­cji Nau­ko­wej.

 Baza Wiedzy PB – Dodawanie danych badawczych – Instrukcja

Zasady udo­stęp­nia­nia danych badaw­czych

Dane badaw­cze mogą być udo­stęp­niane:

  • jako Otwarte (ang. Open Rese­arch Data) co ozna­cza, że każdy użyt­kow­nik ma do nich dostęp oraz moż­li­wość prze­twa­rza­nia i udo­stęp­nia­nia innym.

jako Zamknięte ze względu na wraż­li­wość danych oso­bo­wych, ogra­ni­cze­nia zwią­zane z pra­wami autor­skimi, czy komer­cja­li­za­cję wyni­ków badań.

Dane powinny być tak otwarte, jak to moż­liwe i na tyle zamknięte, na ile jest to konieczne.

Dane badaw­cze naj­czę­ściej udo­stęp­niane są w postaci tzw. data­se­tów, czyli zbio­rów sta­no­wią­cych pewną odrębną całość i zawie­rających dane powią­zane z jedną publi­ka­cją, pro­jek­tem nauko­wym, bądź eks­pe­ry­men­tem.

Przy­go­to­wa­nie oraz udo­stęp­nia­nie danych powinno odby­wać się zgod­nie z zasa­dami FAIR:

  • Fin­da­ble (łatwe do odna­le­zie­nia) – zbiór danych opa­trzony jest meta­da­nymi łatwymi do odna­le­zie­nia w repo­zy­to­rium i ma przy­pi­sany uni­kalny iden­ty­fi­ka­tor (np. DOI); meta­dane są indek­so­wane w ogól­no­do­stęp­nych bazach danych umoż­li­wia­ją­cych ich prze­szu­ki­wa­nie,
  • Acces­si­ble (dostępne) – dane są dostępne dzięki uni­kal­nemu iden­ty­fi­ka­to­rowi oraz nie wyma­gają spe­cjal­nego opro­gra­mo­wa­nia do odczytu; meta­dane dostępne są nawet po usu­nię­ciu zbioru danych
  • Inte­ro­pe­ra­ble (inte­ro­pe­ra­cyjne) – dane oraz meta­dane są w for­ma­cie zapew­nia­ją­cym łatwy odczyt i prze­twa­rza­nie dla ludzi i kom­pu­te­rów; dane można łączyć z innymi zbio­rami danych,
  • Reu­sa­ble (moż­liwe do ponow­nego uży­cia) – meta­dane zawie­rają infor­ma­cje o auto­rze, miej­scu powsta­nia danych, rodzaju danych, spo­so­bie ich pozy­ski­wa­nia oraz o moż­li­wo­ści ich wyko­rzy­sta­nia; dane zawie­rają licen­cję okre­śla­jącą warunki ponow­nego wyko­rzy­sta­nia i prze­twa­rza­nia danych.

Zasady FAIR są wciąż roz­wi­jane i dopre­cy­zo­wy­wane przez mię­dzy­na­ro­dową spo­łecz­ność GO FAIR.

Polityka otwartego dostępu do danych badawczych finansowanych ze środków publicznych

  • surowe – zebrane, ale nie przeanalizowane;
  • obserwacyjne – przechwytywane w czasie rzeczywistym (np. odczyty czujników, dane telemetryczne, wyniki anonimowych ankiet, badania fokusowe), często unikalne, ponieważ nie można ich „odzyskać”;
  • eksperymentalne – uzyskane ze sprzętu laboratoryjnego w kontrolowanych warunkach, powtarzalne, ale często bardzo kosztowne (np. sekwencje genów, spektroskopia, odczyty pola magnetycznego);
  • dane symulacji – zebrane podczas testów badających rzeczywiste lub teoretyczne systemy (np. modele klimatyczne, ekonomiczne, systemy inżynieryjne);
  • dane pochodne / skompilowane – wyniki analiz danych, albo dane agregowane z różnych źródeł. Powtarzalne, ale ich pozyskanie może być bardzo kosztowne (bazy danych, teksty, modele 3D, dane bibliometryczne);
  • dane referencyjne – poprawione lub organiczne zbiory danych, zwykle recenzowane, publikowane i selekcjonowane (dane GUS, struktury chemiczne, bazy danych z sekwencjami genów).

  • dzienniki, pamiętniki,
  • zeszyty laboratoryjne i terenowe, notatki z eksperymentów,
  • protokoły laboratoryjne, opisy metodologiczne,
  • dokumenty tekstowe i arkusze kalkulacyjne,
  • kwestionariusze ankiet i wywiadu,
  • odpowiedzi testowe,
  • fotografie i slajdy,
  • prezentacje,
  • nagrania audio i video,
  • artefakty, okazy, próbki.
  • pliki danych,
  • standardowe procedury i protokoły operacyjne,
  • modele matematyczne, algorytmy,
  • oprogramowanie,
  • wyniki symulacji komputerowych.

Dane tekstowe
  • .txt (Plain text)
  • .pdf (Portable Document Format)
  • .tex (LaTeX documents)
  • .html (Hypertext Markup Language)
  • .odt (Open Document Format)
  • .xml (Extensible Markup Language)
Tabele, arkusze kalkulacyjne, bazy
  • .txt/.tsv/.tab (Tab-separated tables)
  • .csv/.txt (Comma-separated tables)
    Standardowe separatory, np. dwukropek, pionowa kreska
    (Other standard delimiter, e.g. colon, pipe)
    Format stałej szerokości (Fixed-width)
  • .ods (OpenDocument Spreadsheet)
  • .odb (OpenDocument Database)
Obrazy
  • .tiff/.tif (TIFF)
  • .jpg/.jp2 (JPEG)
  • .png (Portable Network Graphics)
  • .svg (Scalable Vector Graphics)
  • .pdf (Portable Document Format)
  • .gif (Graphics Interchange Format)
  • .bmp (Microsoft Windows Bitmap Format)
Pliki audio
  • .wav (WAVE)
  • .flac (FLAC)
  • .mp3 (MPEG-3) – zazwyczaj odpowiedni dla rejestru ludzkiego
    głosu i dźwięku o średniej jakości, ale może być nieodpowiedni
    dla dźwięku Hi-Fi
  • .aiff (Audio Interchange File Format)
Pliki wideo
  • .mp4 (MPEG-4)
  • .mxf (Material Exchange Format)
Dane geoprzestrzenne
  • .tiff (Geo-Referenced TIFF)
  • .shp, .shx, .dbf (ESRI Shapefile)
  • .kml (Keyhole Markup Language)
  • .nc (Network Common Data Format)
Dane internetowe
  • .json (Javascript Object Notation)
  • .xml (Extensible Markup Language)
  • .html (Hypertext Markup Language)
Dane z sieci
  • .warc (WebARChive)
Wielowymiarowe tablice
  • .cdf (Common Data Format)
  • .nc (Network Common Data Format)
  • .hdf/.h5 (Hierarchical Data Format)
e-book
  • .epub (Electronic Publication)

Źródło: File Formats – Research Data Management – Best Practices – Research Guides at Ohio State University

Plik typu „readme” powinien zawierać jasny i zwięzły opis zdeponowanych danych badawczych. Plik pozwala zrozumieć i właściwie zinterpretować zdeponowane dane. Informacje, które powinny się znaleźć w pliku README:

  • tytuł,
  • autor/autorzy,
  • cel badań i opis projektu,
  • metodologię badań – miejsce czas i sposób pozyskiwania danych,
  • opis udostępnionych danych, słowa kluczowe,
  • opis udostępnionych plików z danymi badawczymi – język, format, zawartość, informacja o licencji – warunkach korzystania z plików

Zaleca się zapisywanie pliku readme jako tekstu w formacie UTF-8.

DMP (Data Mana­ge­ment Plan) jest doku­men­tem wyma­ga­nym przy skła­da­niu wnio­sków o granty w ramach pro­gra­mów Krajowego Punktu Kontaktowego Programów Badawczych UE HORIZON oraz w kon­kur­sach Naro­do­wego Cen­trum Nauki.

DMPon­line – narzę­dzie online, za pomocą któ­rego można stwo­rzyć DMP. Zawiera także gotowe wzory DMP wyma­gane przez różne insty­tu­cje finan­su­jące bada­nia naukowe. Gotowy plan można pobrać oraz upu­blicz­nić.

DMPTool – narzę­dzie przy­go­to­wu­jące sza­blony DMP dosto­so­wane do wyma­gań ame­ry­kań­skich gran­to­daw­ców.

Wzory pla­nów zarzą­dza­nia danymi i infor­ma­cje doty­czące PZD na stro­nach biblio­tek: