Univerzita Karlova hlavním koordinátorem rozsáhlého projektu Otevřené velké jazykové modely pro umělou inteligenci v Evropě ****************************************************************************************** * ****************************************************************************************** English see below Praha, 3. 2. 2025 – Přední evropské firmy, výzkumné instituce a velká výpočetní centra zab umělou inteligencí spojují své síly a odborné znalosti, aby v projektu OpenEuroLLM vyvinul velké jazykové modely nové generace podporující rozvoj evropských schopností v oblasti umě Univerzita Karlova je hlavním koordinátorem projektu. Konsorcium 20 předních evropských výzkumných institucí, firem a center EuroHPC, které koor Hajič z Univerzity Karlovy a spoluvede Peter Sarlin (AMD Silo AI, Finsko), vybuduje rodinu vícejazyčných velkých jazykových modelů (LLM) pro komerční, průmyslové a veřejné služby. „ modely s otevřeným zdrojovým kódem, vyhovující i evropské regulaci, demokratizují přístup kvalitním technologiím v oboru umělé inteligence a posílí schopnost evropských firem konku globálním trhu a veřejným organizacím umožní poskytovat účinné veřejné služby,“ vysvětlil projektu prof. Jan Hajič z Matematicko-fyzikální fakulty UK. Projekt OpenEuroLLM je v souladu s potřebou zlepšit konkurenceschopnost a digitální suvere „Projekt je ukázkovým příkladem spolupráce různých sektorů pro vývoj evropských produktů u respektujících hodnoty uznávané v celém evropském technologickém ekosystému. Modely budou evropský regulační rámec, který zajišťuje soulad s evropskými hodnotami a zároveň umožňuje technologickou excelenci,“ podtrhla rektorka Univerzity Karlovy prof. Milena Králíčková.  Ve spolupráci s komunitami podporujícími otevřenou vědu, jako je LAION, open-sci a OpenML, odborníky v oboru umělé inteligence sdruženými v rámci poradního výboru projektu (OpenEuro Strategic Partnership Board) zajistí, že modely, software, data a evaluační postupy budou a budou moci být doladěny pro specifické potřeby výzkumu, průmyslu i veřejného sektoru. Ty vícejazyčné modely zachovají jazykovou i kulturní rozmanitost a v éře umělé inteligence um společnostem vyvíjet vysoce kvalitní produkty a služby. Projekt, kterému byla udělena pečeť STEP (Strategic Technologies for Europe Platform), vyu předchozích evropských projektů a zkušeností partnerů, včetně rozsáhlých vysoce kvalitních vyvinutých pilotních velkých jazykových modelů. Konsorcium zahájí svou činnost 1. února 20 financováno Evropskou komisí v rámci programu Digitální Evropa. Projekt zapadá do bohaté české národní scény s řadou center, univerzit a startupů zabývají v oblasti umělé inteligence a zpracování přirozeného jazyka. Univerzita Karlova podporuje řadou projektů a aktivit, včetně účasti v národním ekosystému EOSC CZ, v několika evropský infrastrukturách a také spoluprací s univerzitami a výzkumnými centry v Evropě i mimo ni. evropských programů podporovaných přímo Evropskou komisí je OpenEuroLLM projekt s dosud ne objemem financování koordinovaný z ČR (celkem 34 mil. EUR plus kapacity EuroHPC poskytnuté Povinné kofinancování zajišťuje MŠMT ČR. Seznam partnerů projektu: Univerzity a výzkumné organizace: Charles University [ URL "https://ufal.mff.cuni.cz"] (Ústav formální a aplikované lingvist (koordinátor) Alliance for Language Technologies EDIC [ URL "https://language-data-space.ec.europa.eu/re initiatives/alt-edic_en"] (ALT-EDIC), Francie Eindhoven University of Technology [ URL "https://www.tue.nl/en/"] , Holandsko ELLIS Institute Tübingen [ URL "https://institute-tue.ellis.eu/"] , Německo Fraunhofer IAIS [ URL "https://www.iais.fraunhofer.de/en.html"] , Německo Lindholmen Science Park [ URL "https://www.ai.se/en"] (AI Sweden), Švédsko Research Center Juelich [ URL "https://www.fz-juelich.de/en"] , Německo University of Helsinki [ URL "https://www.helsinki.fi/en"] , Finsko University of Oslo [ URL "https://www.uio.no/english/"] , Norsko University of Turku [ URL "https://www.utu.fi/en"] , Finsko University of Tübingen [ URL "https://tuebingen.ai/"] (Tübingen AI Center), Německo Firmy: Silo GenAI [ URL "https://www.silo.ai/"] (AMD Silo AI), Finsko (spoluvedení projektu) Aleph Alpha Research [ URL "https://aleph-alpha.com/"] , Německo  ellamind [ URL "https://ellamind.com/"] , Německo LightOn [ URL "https://www.lighton.ai/"] , Francie Prompsit Language Engineering [ URL "https://www.prompsit.com/"] , Španělsko  EuroHPC centra: Barcelona Supercomputing Center [ URL "https://www.bsc.es/"] , Španělsko Cineca Interuniversity Consortium [ URL "https://www.cineca.it/en"] , Itálie CSC - IT Center for Science [ URL "https://csc.fi/en/"] , Finsko SURF [ URL "https://www.surf.nl/en"] , Holandsko Kontakt: Jan Hajič [ URL "https://ufal.mff.cuni.cz/jan-hajic"] , hajic@ufal.mff.cuni.cz [ "mailto:hajic@ufal.mff.cuni.cz"] , +420 607 209 212 Ústav formální a aplikované lingvistiky [ URL "https://ufal.mff.cuni.cz"] , sekce informat "https://cs.mff.cuni.cz/cs"] Matematicko-fyzikální fakulty [ URL "https://www.mff.cuni.cz" Karlovy [ URL "https://cuni.cz/UK-1.html"] (ÚFAL MFF UK) se sídlem v Praze, je výzkumný ús třicetiletou tradicí a plným magisterským a doktorandským programem v oblasti počítačové l zpracování přirozeného jazyka. Podílel se nebo koordinoval mnoho projektů financovaných Ev nebo agenturami v USA, a vedl i velké národní projekty. V rámci Ústavu je provozován i nár uzel evropských výzkumných infrastruktur CLARIN, DARIAH a EHRI. Jeho přibližně 100 zaměstn 30 doktorandů) kombinuje výzkumnou a pedagogickou expertízu v mnoha oblastech informatiky, výpočetní lingvistiky, teoretické lingvistiky, umělé inteligence a zpracování přirozeného na Ústav je ufal@ufal.mff.cuni.cz [ URL "mailto:ufal@ufal.mff.cuni.cz"] . [ URL ""] Tisková zpráva ke stažení zde. [ URL "UK-14417-version1-2025_02_03_tz_openeuro_llm.docx"] *========================================================================================= * Charles University as the main coordinator of a large-scale project Open LLMs for Transp Europe *========================================================================================= Europe's leading AI companies and research institutions combine their forces and expertise next-generation open-source language models in an unprecedented collaboration to advance E capabilities, the OpenEuroLLM project. A consortium of 20 leading European research institutions, companies and EuroHPC centres c Jan Hajič from Charles University, Czechia, and co-led by Peter Sarlin (AMD Silo AI, Finla family of performant, multilingual, large language foundation models for commercial, indus services. “The transparent and compliant open-source models will democratize access to hig technologies and strengthen the ability of European companies to compete on a global marke organizations to produce impactful public services,” explained the project coordinator Pro the Faculty of Mathematics and Physics of Charles University. The OpenEuroLLM project is aligned with the imperative to improve Europe’s competitiveness sovereignty. “The project is a prime example of the type of technology infrastructure need thresholds for European AI product development and refinement, demonstrating the strength openness and community involvement, values largely recognized across the European tech eco models will be developed within Europe's robust regulatory framework, ensuring alignment w values while maintaining technological excellence,” underlined the Rector of Charles Unive Milena Králíčková. Cooperating with open-source and open science communities like LAION, open-sci and OpenML, experts in the field assembled in the project’s Open Strategic Partnership Board, OpenEuro that the models, software, data and evaluation will be fully open and can be fine-tuned an tuned for specific industry and public sector needs. These performant multilingual models linguistic and cultural diversity, enabling European companies to develop high-quality pro services in the era of AI. The project, which has been awarded the STEP (Strategic Technologies for Europe Platform) support from previous European projects and the experience of the partners and their resul large repositories of high-quality data and pilot LLMs developed previously. The consortiu work on February 1st, 2025, with funding from the European Commission under the Digital Eu The projects fit in with the rich Czech national scene, with a number of centres, universi ups involved in AI and NLP research. Charles University and the host Institute promote ope a number of projects and activities, including the national EOSC CZ ecosystem, several Eur Infrastructures and by cooperation with both universities and research centres in Europe a required co-funding will be provided by the Ministry of Education, Youth and Sports. Full list of partners: Universities and Research Organizations: Charles University [ URL "https://ufal.mff.cuni.cz"] (Institute of Formal and Applied Ling (coordinator) Alliance for Language Technologies EDIC [ URL "https://language-data-space.ec.europa.eu/re initiatives/alt-edic_en"] (ALT-EDIC), France Eindhoven University of Technology [ URL "https://www.tue.nl/en/"] , the Netherlands  ELLIS Institute Tübingen [ URL "https://institute-tue.ellis.eu/"] , Germany Fraunhofer IAIS [ URL "https://www.iais.fraunhofer.de/en.html"] , Germany Lindholmen Science Park [ URL "https://www.ai.se/en"] (AI Sweden), Sweden Research Center Juelich [ URL "https://www.fz-juelich.de/en"] , Germany  University of Helsinki [ URL "https://www.helsinki.fi/en"] , Finland University of Oslo [ URL "https://www.uio.no/english/"] , Norway University of Turku [ URL "https://www.utu.fi/en"] , Finland University of Tübingen [ URL "https://tuebingen.ai/"] (Tübingen AI Center), Germany Companies: Silo GenAI [ URL "https://www.silo.ai/"] (AMD Silo AI), Finland (co-lead) Aleph Alpha Research [ URL "https://aleph-alpha.com/"] , Germany  ellamind [ URL "https://ellamind.com/"] , Germany  LightOn [ URL "https://www.lighton.ai/"] , France  Prompsit Language Engineering [ URL "https://www.prompsit.com/"] , Spain  EuroHPC centres: Barcelona Supercomputing Center [ URL "https://www.bsc.es/"] , Spain Cineca Interuniversity Consortium [ URL "https://www.cineca.it/en"] , Italy  CSC - IT Center for Science [ URL "https://csc.fi/en/"] , Finland SURF [ URL "https://www.surf.nl/en"] , the Netherlands Contact: Jan Hajič [ URL "https://ufal.mff.cuni.cz/jan-hajic"] , hajic@ufal.mff.cuni.cz [ "mailto:hajic@ufal.mff.cuni.cz"] , +420 607 209 212 The Institute of Formal and Applied Linguistics [ URL "https://ufal.mff.cuni.cz"] , School Science [ URL "https://cs.mff.cuni.cz/en/about-school"] , Faculty of Mathematics and Physi "https://www.mff.cuni.cz/en"] , Charles University [ URL "https://cuni.cz/UKEN-1.html"] , Czechia, is a 30-years old research institute with a full Masters and PhD programmes in Co Linguistics and Natural Language Processing. It has participated in or coordinated many EU projects as well as large national ones, and it runs the national technical node of the Eu DARIAH and EHRI Research Infrastructures. Its staff of about 100 (including about 30 Ph.D. combines research and teaching expertise in computer science, deep learning, computational theoretical linguistics, AI and NLP fields. The Institute can be reached at ufal@ufal.mff. "mailto:ufal@ufal.mff.cuni.cz"] . [ URL ""] *========================================================================================= * *=========================================================================================