Przejdź do treści
ohistorie logo

ISSN 2545-3459

Menu główne
  • O nas
    • Wydawca
    • Redakcja
  • Ohistorie
  • Kategorie
    • Artykuły
    • Aktualności
    • Opinie
    • Varia
    • Wywiady
    • wszystkie
    • Edukacja
    • Filmy
  • Kontakt
  • Współpraca
    • Informacja dla Autorów
  • Archiwum Ohistorie
  • Dom
  • 2024
  • marzec
  • J
  • Nowoczesne technologie w humanistyce. Cz. 2. Możliwości, ograniczenia, zagrożenia
  • Dyskusje

Nowoczesne technologie w humanistyce. Cz. 2. Możliwości, ograniczenia, zagrożenia

Piotr Witek 26 marca 2024 4 minutes read
Clarin-cz-2-min-pomn

Portal ohistorie.eu zaprasza do obejrzenia i wysłuchania rozmowy:

Nowoczesne technologie w humanistyce

| Część  II |

Możliwości, ograniczenia, zagrożenia

Rozmowa koncentruje się na zagadnieniach związanych z projektowaniem i realizacją badań z wykorzystaniem nowoczesnej infrastruktury. Omówione zostają zarówno możliwości i perspektywy, jak i ograniczenia oraz zagrożenia, z którymi mogą się zetknąć humaniści (i nie tylko) chcący wykorzystać w praktyce badawczej wyspecjalizowane narzędzia cyfrowe. Podczas dyskusji zostało podjętych kilka wątków, m.in.: Czy prowadzenie badań z użyciem nowych technologii to nauka czy może efekciarstwo dla leniwych? Czy humanista wykorzystujący nowe technologie to świadomy naukowiec czy raczej rzemieślnik i operator narzędzi? Na ile nowoczesna infrastruktura badawcza wspomaga humanistów w ich badaniach, a na ile ich wyręcza? Jaki wpływ na projektowanie i realizację badań ma rozwój technologii? Charakterystyce dyskutowanych problemów, wśród których pojawia się także kwestia aplikowania o granty i polityka otwartości danych, towarzyszą liczne odwołania do konkretnych przykładów wykorzystania nowoczesnej infrastruktury w praktyce badawczej.

W rozmowie biorą udział eksperci:

Dr Jan Wieczorek (CLARIN)

CLARIN-PL, Katedra Sztucznej Inteligencji Politechniki Wrocławskiej

Dr Beata Jarosz (UMCS)

Instytut Językoznawstwa i Literaturoznawstwa UMCS w Lublinie

Pod materiałem wideo publikujemy słownik pojęć z obszaru humanistyki cyfrowej opracowany przez dr Beatę Jarosz (konsultacja merytoryczna: dr Jan Wieczorek).

Distant reading – metoda analizy dużych zbiorów tekstów literackich przy użyciu nowoczesnej infrastruktury, w tym narzędzi opartych na automatycznym przetwarzaniu języka naturalnego. Twórca termin i założeń teoretycznych – Franco Moretti (Conjectures on World Literature, „New Left Review” 2000).

Analiza topikowa (ang. topic modeling; inaczej: analiza tematyczna) – automatyczne identyfikowanie tematów występujących zarówno w pojedynczym tekście, jak i w ogromnym korpusie. Jedną z technik wykorzystywanych w tym celu jest LDA (Latent Dirichlet Allocation ‘ukryta alokacja Dirichleta’), która polega na identyfikacji tematów w zbiorze tekstów na podstawie analizy częstości współwystępowania słów i ich wzajemnych relacji.

Stylometria – metoda analizy tekstu, która pozwala ustalać autorstwo lub chronologię tekstu na podstawie charakterystyki gramatycznego stylu pisania. Badania stylometryczne mogą być też wykorzystywane m.in. do wykrywania plagiatu czy identyfikowania różnic stylistycznych w tekstach różnych autorów. Narzędzia do automatycznej stylometrii (np. WebSty) pozwalają uzyskać informacje o statystykach wyrazów, ich bogactwie czy przynależności tematycznej, dzięki czemu możliwe jest określenie charakterystycznych cech opisujących i różnicujących.

Anotacja – systematyczne oznaczanie słów, fragmentów tekstu lub całych dokumentów etykietami w celu skategoryzowania poszczególnych segmentów lub wprowadzenia dodatkowych informacji. Taki opis (wykonywany np. w aplikacji Inforex) ułatwia przeszukiwanie i analizę materiałów zgromadzonych w korpusie.

Model transformatywno-generatywny – model stosowany w uczeniu maszynowym (tzn. w programowaniu komputerowym), który (1) dokonuje przetwarzania tekstów oraz innych typów danych i (2) służy do generowania tekstu lub innych zasobów na podstawie przetworzonych danych wejściowych. MTG ma zastosowanie m.in. w tłumaczeniu maszynowym, automatycznym streszczaniu tekstów lub w tworzeniu chatbotów.

Halucynacje – zjawisko generowania przez sztuczną inteligencję danych i wyobrażeń, które nie są zgodne z rzeczywistością albo nie mają odpowiedniego odniesienia do danych wejściowych. Halucynacje mogą obejmować m.in. generowanie tekstu zawierającego nieprawdziwe informacje lub nielogiczne wnioski albo obrazów przedstawiających nieistniejące obiekty lub sceny.

OCR-owanie (ang. optical character recognition ‘optyczne rozpoznawanie znaków’) – proces przekształcania przy pomocy specjalnego oprogramowania zeskanowanego tekstu lub obrazu na dane tekstowe (wyrażone w postaci liter i znaków), które można następnie edytować, grupować i przetwarzać komputerowo.

Język CQL (Corpus Query Language ‘język zapytań korpusowych’)– specjalny język zapytań wykorzystywany w lingwistyce korpusowej i w innych dziedzinach zajmujących się przetwarzaniem języka naturalnego. Umożliwia (np. w programie Sketch Engine) wyszukiwanie w korpusie złożonych wzorców gramatycznych lub leksykalnych (przydatnych w analizie składniowej i semantycznej) oraz formułowanie złożonych zapytań (np. statystycznych) z uwzględnieniem kryteriów wyszukiwania, których nie można ustawić przy użyciu standardowego interfejsu użytkownika.

O autorze

Piotr Witek

Administrator

Wyświetl wszystkie posty

Post navigation

Previous: Postawy kobiet wobec wojny w dziennikach Polek z czasów I wojny światowej (1)
Next: Wycinanki (148)

Related News

Ikonka Metadokument Zagłady
2 minutes read
  • Dyskusje
  • Filmy
  • Varia
  • Wywiady

Metadokument Zagłady: ekspozycja historyczna w Sobiborze

Piotr Witek 4 lutego 2026 0
miniatura
27 minutes read
  • Dyskusje
  • Wywiady

Otwarte zasoby językowe w praktyce badawczej. Rozmowa z dr. Marcinem Oleksym (Clarin-pl)

Piotr Witek 14 sierpnia 2025 0
vlcsnap-2025-07-18-00h37m37s790
1 minute read
  • Aktualności
  • Dyskusje
  • Wywiady

Rekonstrukcja historyczna w doświadczeniu historyka

Piotr Witek 18 lipca 2025 0

Nasze najnowsze teksty

237up
7 minutes read
  • Felietony
  • Varia

WOJCIECH WRZOSEK Wycinanki (237) Co to jest strong artificial intelligence (SAI)

Ewa Solska 10 marca 2026 0
fot dr Bartosz Kałużny
12 minutes read
  • Felietony
  • Varia

Mateusz Wyżga. Wycinanki staropolskie (5) Frustracja Świętosława

Ewa Solska 6 marca 2026 0
236up
4 minutes read
  • Felietony
  • Varia
  • wszystkie

WOJCIECH WRZOSEK Wycinanki (236) Jak nie rezonować Znanieckiemu?

Ewa Solska 24 lutego 2026 0
ChatGPT Image 22 lut 2026, 16_24_18
27 minutes read
  • Artykuły
  • Varia

Cyfrowa audiowizualność a historia. Technologia AI DeepFake

Piotr Witek 22 lutego 2026 0
  • O nas
  • Ohistorie
  • Kategorie
  • Kontakt
  • Współpraca
  • Archiwum Ohistorie
Copyright © All rights reserved. | MoreNews przez AF themes.