Seminarium Data Science

Miejsce wydarzenia: Stefana Banacha 22, 90-238 Łódź
Czas: 28 listopada 2024 (czwartek) 14:15 - 16:00

Zapraszamy na Seminarium Data Science, które odbędzie się w czwartek 28 listopada o godz. 14.15 w sali D203.

Wykład pt.  Czy potrzebujemy polskich generatywnych modeli językowych? wygłosi dr hab. Piotr Pęzik, prof UŁ.

Streszczenie

W dobie uniwersalnych generatywnych modeli językowych (GMJ, ang. LLM), tworzonych przez światowych gigantów technologicznych rodzi się pytanie o potrzebę tworzenia modeli dostosowanych do przetwarzania języka polskiego. Takie założenie z pewnością przyświeca autorom polskiego modelu językowego PLLuM (https://pllum.org.pl). Wystąpienie przybliży główne fazy tworzenia tego modelu, takie jak trening bazowy, dostrajanie na instrukcjach, ‘wychowanie’ i zabezpieczanie na preferencjach. Poza kwestiami technicznymi omówione zostaną istotne aspekty prawne oraz potencjalne zastosowania PLLuM jako modelu dostosowanego do generowania i przetwarzania języka polskiego. 

O Autorze

Piotr Pęzik jest kierownikiem Zakładu Językoznawstwa Korpusowego i Komputerowego w Uniwersytecie Łódzkim. Autor licznych publikacji i rozwiązań informatycznych m.in. z dziedziny przetwarzania języka naturalnego. Odbył kilkuletni staż naukowy w grupie Ekstrakcji Informacji Europejskiego Instytutu Bioinformatyki w Cambridge, był konsultantem Institut für Deutsche Sprache w Mannheim w zakresie wielkoskalowych narzędzi korpusowych, a także członkiem Aston Institute for Forensic Linguistics. W ostatnim czasie jest zaangażowany w prace nad modelem generatywnym PLLuM (https://pllum.org.pl).  

SERDECZNIE ZAPRASZAMY!

Szczegóły wydarzenia

Miejsce wydarzenia: Stefana Banacha 22, 90-238 Łódź

Data i godziny wydarzenia: 28 listopada 2024 (czwartek) 14:15 - 16:00

  • PN
  • WT
  • ŚR
  • CZ
  • PT
  • SB
  • ND