• PR & média
  • Média
  • Tiskové zprávy
  • Univerzita Karlova hlavním koordinátorem rozsáhlého projektu Otevřené velké jazykové modely pro umělou inteligenci v Evropě

Univerzita Karlova hlavním koordinátorem rozsáhlého projektu Otevřené velké jazykové modely pro umělou inteligenci v Evropě

English see below


Praha, 3. 2. 2025 – Přední evropské firmy, výzkumné instituce a velká výpočetní centra zabývající se umělou inteligencí spojují své síly a odborné znalosti, aby v projektu OpenEuroLLM vyvinuly otevřené velké jazykové modely nové generace podporující rozvoj evropských schopností v oblasti umělé inteligence. Univerzita Karlova je hlavním koordinátorem projektu.


Konsorcium 20 předních evropských výzkumných institucí, firem a center EuroHPC, které koordinuje Jan Hajič z Univerzity Karlovy a spoluvede Peter Sarlin (AMD Silo AI, Finsko), vybuduje rodinu výkonných, vícejazyčných velkých jazykových modelů (LLM) pro komerční, průmyslové a veřejné služby. „Transparentní modely s otevřeným zdrojovým kódem, vyhovující i evropské regulaci, demokratizují přístup k vysoce kvalitním technologiím v oboru umělé inteligence a posílí schopnost evropských firem konkurovat na globálním trhu a veřejným organizacím umožní poskytovat účinné veřejné služby,“ vysvětlil koordinátor projektu prof. Jan Hajič z Matematicko-fyzikální fakulty UK.


Projekt OpenEuroLLM je v souladu s potřebou zlepšit konkurenceschopnost a digitální suverenitu Evropy. „Projekt je ukázkovým příkladem spolupráce různých sektorů pro vývoj evropských produktů umělé inteligence respektujících hodnoty uznávané v celém evropském technologickém ekosystému. Modely budou respektovat evropský regulační rámec, který zajišťuje soulad s evropskými hodnotami a zároveň umožňuje zachovat technologickou excelenci,“ podtrhla rektorka Univerzity Karlovy prof. Milena Králíčková


Ve spolupráci s komunitami podporujícími otevřenou vědu, jako je LAION, open-sci a OpenML, a dalšími odborníky v oboru umělé inteligence sdruženými v rámci poradního výboru projektu (OpenEuroLLM Open Strategic Partnership Board) zajistí, že modely, software, data a evaluační postupy budou plně otevřené a budou moci být doladěny pro specifické potřeby výzkumu, průmyslu i veřejného sektoru. Tyto výkonné vícejazyčné modely zachovají jazykovou i kulturní rozmanitost a v éře umělé inteligence umožní evropským společnostem vyvíjet vysoce kvalitní produkty a služby.


Projekt, kterému byla udělena pečeť STEP (Strategic Technologies for Europe Platform), využívá výsledků předchozích evropských projektů a zkušeností partnerů, včetně rozsáhlých vysoce kvalitních dat a dříve vyvinutých pilotních velkých jazykových modelů. Konsorcium zahájí svou činnost 1. února 2025 a bude financováno Evropskou komisí v rámci programu Digitální Evropa.


Projekt zapadá do bohaté české národní scény s řadou center, univerzit a startupů zabývajících se výzkumem v oblasti umělé inteligence a zpracování přirozeného jazyka. Univerzita Karlova podporuje otevřenou vědu řadou projektů a aktivit, včetně účasti v národním ekosystému EOSC CZ, v několika evropských výzkumných infrastrukturách a také spoluprací s univerzitami a výzkumnými centry v Evropě i mimo ni. V rámci evropských programů podporovaných přímo Evropskou komisí je OpenEuroLLM projekt s dosud největším celkovým objemem financování koordinovaný z ČR (celkem 34 mil. EUR plus kapacity EuroHPC poskytnuté bezplatně). Povinné kofinancování zajišťuje MŠMT ČR.


Seznam partnerů projektu:


Univerzity a výzkumné organizace:

Charles University (Ústav formální a aplikované lingvistiky), (koordinátor)

Alliance for Language Technologies EDIC (ALT-EDIC), Francie

Eindhoven University of Technology, Holandsko

ELLIS Institute Tübingen, Německo

Fraunhofer IAIS, Německo

Lindholmen Science Park (AI Sweden), Švédsko

Research Center Juelich, Německo

University of Helsinki, Finsko

University of Oslo, Norsko

University of Turku, Finsko

University of Tübingen (Tübingen AI Center), Německo


Firmy:

Silo GenAI (AMD Silo AI), Finsko (spoluvedení projektu)

Aleph Alpha Research, Německo 

ellamind, Německo

LightOn, Francie

Prompsit Language Engineering, Španělsko 


EuroHPC centra:

Barcelona Supercomputing Center, Španělsko

Cineca Interuniversity Consortium, Itálie

CSC - IT Center for Science, Finsko

SURF, Holandsko


Kontakt: Jan Hajič, hajic@ufal.mff.cuni.cz, +420 607 209 212


Ústav formální a aplikované lingvistiky, sekce informatiky Matematicko-fyzikální fakulty Univerzity Karlovy (ÚFAL MFF UK) se sídlem v Praze, je výzkumný ústav s více než třicetiletou tradicí a plným magisterským a doktorandským programem v oblasti počítačové lingvistiky a zpracování přirozeného jazyka. Podílel se nebo koordinoval mnoho projektů financovaných Evropskou komisí nebo agenturami v USA, a vedl i velké národní projekty. V rámci Ústavu je provozován i národní technický uzel evropských výzkumných infrastruktur CLARIN, DARIAH a EHRI. Jeho přibližně 100 zaměstnanců (včetně asi 30 doktorandů) kombinuje výzkumnou a pedagogickou expertízu v mnoha oblastech informatiky, hlubokého učení, výpočetní lingvistiky, teoretické lingvistiky, umělé inteligence a zpracování přirozeného jazyka. Kontakt na Ústav je ufal@ufal.mff.cuni.cz.


Tisková zpráva ke stažení zde.



Charles University as the main coordinator of a large-scale project Open LLMs for Transparent AI in Europe


Europe's leading AI companies and research institutions combine their forces and expertise to develop next-generation open-source language models in an unprecedented collaboration to advance European AI capabilities, the OpenEuroLLM project.


A consortium of 20 leading European research institutions, companies and EuroHPC centres coordinated by Jan Hajič from Charles University, Czechia, and co-led by Peter Sarlin (AMD Silo AI, Finland) will build a family of performant, multilingual, large language foundation models for commercial, industrial and public services. “The transparent and compliant open-source models will democratize access to high-quality AI technologies and strengthen the ability of European companies to compete on a global market and public organizations to produce impactful public services,” explained the project coordinator Prof. Jan Hajič from the Faculty of Mathematics and Physics of Charles University.


The OpenEuroLLM project is aligned with the imperative to improve Europe’s competitiveness and digital sovereignty. “The project is a prime example of the type of technology infrastructure needed to lower thresholds for European AI product development and refinement, demonstrating the strength of transparency, openness and community involvement, values largely recognized across the European tech ecosystem. The models will be developed within Europe's robust regulatory framework, ensuring alignment with European values while maintaining technological excellence,” underlined the Rector of Charles University Prof. Milena Králíčková.


Cooperating with open-source and open science communities like LAION, open-sci and OpenML, and additional experts in the field assembled in the project’s Open Strategic Partnership Board, OpenEuroLLM will ensure that the models, software, data and evaluation will be fully open and can be fine-tuned and instruction-tuned for specific industry and public sector needs. These performant multilingual models preserve both linguistic and cultural diversity, enabling European companies to develop high-quality products and services in the era of AI.


The project, which has been awarded the STEP (Strategic Technologies for Europe Platform) seal, leverages support from previous European projects and the experience of the partners and their results, including large repositories of high-quality data and pilot LLMs developed previously. The consortium commences its work on February 1st, 2025, with funding from the European Commission under the Digital Europe Programme.


The projects fit in with the rich Czech national scene, with a number of centres, universities and start-ups involved in AI and NLP research. Charles University and the host Institute promote open science through a number of projects and activities, including the national EOSC CZ ecosystem, several European Research Infrastructures and by cooperation with both universities and research centres in Europe and beyond. The required co-funding will be provided by the Ministry of Education, Youth and Sports.



Full list of partners:


Universities and Research Organizations:

Charles University (Institute of Formal and Applied Linguistics), Czechia (coordinator)

Alliance for Language Technologies EDIC (ALT-EDIC), France

Eindhoven University of Technology, the Netherlands 

ELLIS Institute Tübingen, Germany

Fraunhofer IAIS, Germany

Lindholmen Science Park (AI Sweden), Sweden

Research Center Juelich, Germany 

University of Helsinki, Finland

University of Oslo, Norway

University of Turku, Finland

University of Tübingen (Tübingen AI Center), Germany


Companies:

Silo GenAI (AMD Silo AI), Finland (co-lead)

Aleph Alpha Research, Germany 

ellamind, Germany 

LightOn, France 

Prompsit Language Engineering, Spain 


EuroHPC centres:

Barcelona Supercomputing Center, Spain

Cineca Interuniversity Consortium, Italy 

CSC - IT Center for Science, Finland

SURF, the Netherlands


Contact: Jan Hajič, hajic@ufal.mff.cuni.cz, +420 607 209 212


The Institute of Formal and Applied Linguistics, School of Computer Science, Faculty of Mathematics and Physics, Charles University, Prague, Czechia, is a 30-years old research institute with a full Masters and PhD programmes in Computational Linguistics and Natural Language Processing. It has participated in or coordinated many EU- and U.S.-funded projects as well as large national ones, and it runs the national technical node of the European CLARIN, DARIAH and EHRI Research Infrastructures. Its staff of about 100 (including about 30 Ph.D. students) combines research and teaching expertise in computer science, deep learning, computational linguistics, theoretical linguistics, AI and NLP fields. The Institute can be reached at ufal@ufal.mff.cuni.cz.




Poslední změna: 3. únor 2025 08:16 
Za obsah stránky zodpovídá: Odbor vnějších vztahů
Máte dotaz ?
Kontakty

Univerzita Karlova

Ovocný trh 560/5

Praha 1, 116 36

Česká republika


Identifikátor datové schránky: piyj9b4

IČO: 00216208 

DIČ: CZ00216208




Jak k nám