Fortschritt durch
offene Zusammenarbeit
Open-Source-Forschung ist Teil unserer DNA. Hier teilen wir, woran wir im Bereich Sprachmodelle, Evaluation und KI-Agenten arbeiten.
Aus unserer Forschung
propella-1
Eine Familie kleiner multilingualer LLMs zur Annotation von Textdokumenten in sechs Kategorien: Kerninhalt, Klassifikation, Qualität und Wert, Zielgruppe und Zweck, Sicherheit und Compliance sowie geografische Relevanz. Die Annotationen helfen dabei, LLM-Trainingsdaten in großem Umfang zu filtern, auszuwählen und zu kuratieren. Die Modelle übertreffen deutlich größere General-Purpose-Baselines.
sui-1: Summarization with Unique Identifiers
Ein 24B-Parameter-LLM für abstrakte Zusammenfassungen mit Inline-Zitaten. Jede Aussage lässt sich auf den zugrunde liegenden Quellsatz zurückführen. Das Modell unterstützt Dokumente mit mehr als 2 Mio. Tokens und übertrifft alle getesteten Open-Weight-Baselines, einschließlich Modelle mit 3x mehr Parametern.
base-eval
Kuratierte Konfigurationen für lm-evaluation-harness zur Evaluation englischer und deutscher Basismodelle. Jede Aufgabe wird gegen Referenzmodelle validiert und bildet die Grundlage für Benchmark-Suiten im frühen Pretraining und in der In-Loop-Evaluation.
inference-hive
Verteilte LLM-Inferenz in großem Umfang für SLURM-Cluster. Konfigurieren Sie Cluster-, Server- und Dateneinstellungen und skalieren Sie anschließend mit nahezu linearem Durchsatz über Tausende GPUs.
Öffentlich geförderte Forschungsprojekte
Transparente KI für Europa
ellamind ist Teil eines Konsortiums aus 20 führenden europäischen Forschungseinrichtungen, Unternehmen und EuroHPC-Zentren, das eine Familie leistungsstarker multilingualer Foundation Models für kommerzielle, industrielle und öffentliche Anwendungen entwickelt. Diese transparenten und regelkonformen Open-Source-Modelle sollen den Zugang zu hochwertiger KI demokratisieren und Europas Wettbewerbsfähigkeit stärken.
Mehr erfahren
Europas KI-Zukunft gestalten
Als Partner in LLMs4EU wirkt ellamind an der Entwicklung modernster Sprachmodelle mit, bei denen europäische Sprachen, Werte und Innovationen im Mittelpunkt stehen. Dieses EU-geförderte Konsortium bündelt Expertise aus ganz Europa, um KI-Technologien zu entwickeln, die europäischen Anforderungen wirklich gerecht werden. Unser Open-Source-Ansatz hilft Organisationen jeder Größe, von fortschrittlicher KI zu profitieren.
Mehr erfahrenOpen Source KI für KMU
LLM4KMU bringt führende Forschungseinrichtungen, Unternehmen und Innovationspartner in Nordrhein-Westfalen zusammen, um kleinen und mittleren Unternehmen den Zugang zu großen Sprachmodellen zu erleichtern. Mit einer gemeinsamen Experimentierplattform, geteiltem Know-how und prototypischen Anwendungsfällen hilft das Projekt KMU dabei, Open-Source-KI in reale Produkte und Dienstleistungen zu überführen.
Mehr erfahrenOffene & rechtskonforme KI für Europa
ellamind ist Teil von SOOFI (Sovereign Open Source Foundation Models), einem deutschen Konsortium aus Forschungseinrichtungen und Start-ups, das offene und souveräne KI-Sprachmodelle als europäische Alternative zu bestehenden Systemen entwickelt. SOOFI verfolgt das Ziel, ein leistungsstarkes Open-Source-Foundation-Model zu entwickeln, das europäischen Werten entspricht und regulatorische Anforderungen von Anfang an mitdenkt.
Wir arbeiten aktiv mit Forschungsgemeinschaften und Partnern wie LAION, Open-Sci, ontocord.ai, OpenEuroLLM, Hessian.AI, Alignment Lab AI, DFKI und weiteren zusammen, um Ressourcen zu bündeln, Wissen zu teilen und das kollektive Verständnis von LLMs voranzubringen.
Open-Source
KI-Forschung
ellamind ist aus der Open-Source-KI-Community hervorgegangen. Unser Team hat einige der ersten und meistgenutzten offenen deutschsprachigen großen Sprachmodelle trainiert und veröffentlicht, die auf Hugging Face mehr als 1.000.000 Mal heruntergeladen wurden. Diese praktische Erfahrung im Training, in der Evaluation und im Einsatz von LLMs über Sprachen, Domänen und Anwendungsfälle hinweg ist das Fundament, auf dem alles bei ellamind aufbaut.
Deutsche LLMs
Wir haben offene deutschsprachige Sprachmodelle zu einer Zeit entwickelt, als gute, nicht-englische LLMs noch Mangelware waren, und so ein lebendiges Ökosystem für deutsche KI mitbegründet.
Von der Forschung zum Produkt
Unsere tiefgehende Expertise in Modelltraining und Evaluation fließt direkt in die Entwicklung unserer Produkte ein. Wir verstehen LLMs von innen heraus und sind nicht nur API-Nutzer.
Pre-Training- & Fine-Tuning-Expertise
Wir verfügen über tiefgehende praktische Erfahrung im kontinuierlichen Pre-Training und Fine-Tuning von Sprachmodellen und können Modelle dadurch gezielt an Aufgaben und Sprachen anpassen.
Evaluation & offene Datensätze
Wir entwickeln fortgeschrittene Evaluierungstechniken und veröffentlichen Open-Source-Datensätze und Benchmarks, die die Community nutzt, um bestehende und neue Modelle zu verbessern.
Community-getrieben
Durch DiscoResearch und Kooperationen mit Hessian.AI, LAION und DFKI setzen wir seit jeher auf Offenheit und Zusammenarbeit als Treiber für die besten KI-Ergebnisse.
Häufig gestellte Fragen
Hier finden Sie Antworten auf häufig gestellte Fragen zu unserer Forschung. Wenn Ihre Frage nicht beantwortet wird, kontaktieren Sie uns gerne.