Leistungen

Maßgeschneiderte AI-Agents und RAG-Systeme, eingebaut in die Produkte, die Sie ausliefern. Entwickelt in Köln, GDPR-konform von Haus aus – produktionsreif, nicht nur Demo.

Maßgeschneiderte AI-Agents

Agents, die in Ihr Produkt eingebaut sind – keine generischen Copilots in einer Seitenleiste

RAG auf Ihren Daten

Retrieval-Pipelines, abgestimmt auf Ihre Dokumentationen, Tickets und Knowledge Base

Privates LLM-Deployment

Open-Source-Modelle in Ihrer VPC – Ihre Daten verlassen den Perimeter nie

Vom PoC in die Produktion

Eval-Harnesses, Monitoring, Fallbacks – die Bausteine, die AI auslieferbar machen

Entwickelt in Köln

EU-Unternehmen, GDPR-konform von Haus aus, DACH-Zeitzone

Antwort per E-Mail in 24 Stunden

Kostenlose technische Einschätzung, schriftliche Antwort innerhalb eines Werktags

Was wir entwickeln

Wir bauen produktionsreife AI-Features für Startups und kleine bis mittelständische Unternehmen. Die Ausgangslage ist meistens dieselbe: „Wir wollen AI im Produkt, aber alle Agenturen, mit denen wir gesprochen haben, wollen uns dieselbe Chatbot-Demo verkaufen.“ Genau das machen wir nicht.

  • Maßgeschneiderte AI-Agents, die innerhalb Ihres Produkts agieren – keine generischen Copilots in einer Seitenleiste
  • RAG-Systeme, trainiert auf Ihren Daten: Dokumentationen, Tickets, Codebasen, Knowledge Bases, interne Wikis
  • LLM-Features, integriert in bestehende Apps: Drafting, Zusammenfassung, Klassifikation, Extraktion
  • Workflow-Automatisierung, die LLMs dort einsetzt, wo sie tatsächlich Mehrwert bringen – nicht als Schaufensterdekoration
  • Private LLM-Deployments auf Ihrer eigenen Infrastruktur, wenn Daten Ihren Perimeter nicht verlassen dürfen

Gebaut von Ingenieuren, nicht aus Hype

AI-Features lassen sich leicht demonstrieren – und schwer ausliefern. Die schwierigen Teile – Evaluation Harnesses, Retrieval-Qualität, Token-Budgets, Fallback-Pfade, Observability, Kostenkontrolle – machen den Unterschied zwischen einer schicken Demo und etwas, das Sie zahlenden Kunden vorsetzen können.

Genau auf diese Teile konzentrieren wir uns. Das Ergebnis sind AI-Integrationen, die in der Produktion Bestand haben – keine Piloten, die nach der Launch-Ankündigung still und leise eingestampft werden.

  • Keine Wrapper von der Stange – jeder Agent und jede Pipeline wird für Ihre Daten und Ihr Produkt gebaut
  • Echte Engineering-Disziplin: Tests, Evals, Monitoring, Retries, Graceful Degradation
  • Ehrlich über das, was LLMs nicht können – wir sagen Ihnen, wenn ein Problem ohne AI besser gelöst ist
  • Vom PoC bis in die Produktion: Die meisten AI-Projekte sterben in der Demo-Phase – unsere nicht

Stack & Tooling

Wir sind modellagnostisch und wählen das passende Werkzeug für die jeweilige Aufgabe. Für die meisten Projekte heißt das ein Frontier-Modell (OpenAI GPT, Anthropic Claude, Google Gemini) mit einem klaren Migrationspfad; für sensible Daten oft Open-Source-Modelle (Llama, Mistral, Qwen) in Ihrer VPC.

Modelle: OpenAI, Anthropic Claude, Google Gemini sowie Open Source über Ollama, vLLM oder Hugging Face. Frameworks: LangChain, LlamaIndex und reichlich schlichtes Python, wo Frameworks nur stören. Vektor & Retrieval: Pinecone, Weaviate, Qdrant, pgvector, Hybrid Search mit Reranking. Eval & Observability: LangSmith, Langfuse, eigene Eval-Harnesses. Infrastruktur: AWS, Hetzner, Docker – dort, wo Ihre Daten liegen.

Ihre Daten bleiben Ihre Daten

GDPR-konform von Haus aus – wir sind ein EU-Unternehmen mit EU-Datenstandort und geben Ihre Daten nicht ohne ausdrücklichen, vertraglich geregelten Grund an Dritte weiter. Für sensible Workloads deployen wir private LLMs auf Ihrer Infrastruktur, sodass Prompts und Embeddings Ihr Netzwerk nie verlassen.

Wo Sie sich auf diesem Spektrum positionieren, entscheiden Sie: Managed-API-Anbieter, wenn Geschwindigkeit zählt – Private Deployment, wenn Souveränität zählt. Wir helfen Ihnen, diese Entscheidung anhand Ihrer tatsächlichen Daten, Ihrer tatsächlichen Nutzer und Ihrer tatsächlichen regulatorischen Lage zu treffen – nicht auf Basis von FUD.

  • Privates LLM-Deployment auf Ihrer AWS-, Hetzner- oder On-Prem-Infrastruktur
  • Zero-Retention-Konfigurationen bei API-Anbietern, wenn Private Deployment überdimensioniert ist
  • AVVs (DPAs) abgeschlossen, EU-Datenstandort, kein Training auf Ihren Daten
  • Klare Datenflussdiagramme, damit Ihr Datenschutzbeauftragter und Ihre Kunden genau wissen, was wohin geht

So arbeiten wir

Dasselbe Modell wie bei unserer übrigen Arbeit: kleines Senior-Team, keine Junioren, direkter Zugang zu den Entwicklern, die den Code schreiben. Bei AI-Projekten starten wir in der Regel mit einem eng abgegrenzten PoC – zwei bis vier Wochen, um zu zeigen, dass der Ansatz auf Ihren echten Daten funktioniert – und definieren von dort aus den Produktions-Build.

Starten Sie mit einer kostenlosen technischen Einschätzung: Erzählen Sie uns, was Sie bauen wollen, teilen Sie, was Sie können, über Ihre Daten – und Sie erhalten innerhalb von 24 Stunden eine schriftliche Antwort dazu, ob AI der richtige Ansatz ist, welchen Weg wir gehen würden, eine grobe Timeline und wo die Risiken liegen. Kein Verkaufsgespräch nötig.

Haben Sie ein Projekt im Sinn?

Erhalten Sie eine sofortige Analyse und ein Angebot mit unserem KI-gestützten Projekt-Wizard.