Konfigurieren →
SELBSAI · Ausgabe 2026

Deine KI. Dein Gerät. Deine Regeln.

Souveräne Hardware für lokale Intelligenz. Maßgeschneidert, um starke Modelle innerhalb deines eigenen sicheren Perimeters auszuführen. Keine Abos. Keine Datenlecks. Null Cloud.

Latenz
< 5 ms
Cloud-Kosten
0 €
Datenpfad
Lokal
Beweis statt Versprechen

Vor dem Kauf.

selbsai muss mehr als nur eine gute Idee beweisen. Es braucht sichtbare Datenschutzgrenzen, realistische Fähigkeiten und echten Support, bevor ein Kunde sich bindet.

Standardmäßig privat

Die Inferenz läuft auf dem Gerät. Optionales Preload bleibt isoliert, verschlüsselt und klar begrenzt.

Local first · keine versteckte Cloud-Abhängigkeit

Leistungsfähig genug, um relevant zu sein

Der Stack wird um offene Modellklassen gewählt, die Schreiben, Retrieval, Mehrsprachigkeit und dokumentenlastige Workflows bereits gut abdecken.

7B–30B Klassen · Passung statt Hype

Ein echtes Betriebsversprechen

Menschlicher Support, DHL-Versand und ein sichtbares Kundenportal senken die Hürde, unbekannte Hardware zu kaufen.

Support · Sendungsverfolgung · Portal
Warum On-Premise

Zwei Wege, KI zu nutzen.
Nur einer gehört dir.

Die Cloud ist gemietete Intelligenz — bequem, aber nicht wirklich deine. Selbs AI ist besessene Intelligenz. Hier ist der Tausch, in klarer Sprache.

Cloud-KI

Gemietet

ChatGPT, Gemini, Claude — du fragst, die Antwort reist über das Internet zu einem fremden Server und wieder zurück.

Was du zahlst
Pro Frage, jeden Monat
Wo deine Daten liegen
Auf fremden Servern
Wie schnell es antwortet
120 – 900 ms über das Internet
Wenn das Internet ausfällt
Es funktioniert nicht mehr
Wer den Zugriff entziehen kann
Der Anbieter, jederzeit
Selbs AI
On-Premise

Im Besitz

Ein kleiner, leiser Computer in deinem Zuhause oder Büro, der direkt dort denkt. Nichts verlässt den Raum.

Was du zahlst
Ein planbarer Kauf wie ein Kühlschrank — kein Abo, das mit der Nutzung wächst.
Einmal. Dann gehört es dir.
Wo deine Daten liegen
Auf dem Gerät, bei dir
Wie schnell es antwortet
< 5 ms — lokal
Wenn das Internet ausfällt
Läuft weiter
Wer den Zugriff entziehen kann
Niemand außer dir
Warum Besitz zählt
Privat. Lokal. Deins.

Besitze den Motor.
Behalte den Kontext.

Wenn KI deine Arbeit unterstützt, verdienen dein Leben und dein Unternehmen mehr als gemieteten Cloud-Zugang. Lokale Hardware macht dieses Maß an Privatsphäre, Autonomie und Kontrolle jetzt praktikabel und bezahlbar.

Privatsphäre als Standard

Prompts, Dateien und interner Kontext bleiben innerhalb deines eigenen Perimeters, statt zu einem entfernten Anbieter zu reisen.

Spürbare Autonomie

Keine Remote-Konto-Abhängigkeit, kein Schalter bei einem Provider und keine gemietete Intelligenz zwischen dir und deiner Arbeit.

Bezahlbar genug, um zu besitzen

Ernsthafte lokale KI ist endlich als Hardware praktikabel: ein einmaliges System, das du kontrollierst, statt monatlicher Modellmiete.

Cloud-KI verlangt dauerhaftes Vertrauen. Eigene Hardware lässt dich die Regel setzen.

Alltagliche KI-Arbeit

Alltags-KI, lokal.

selbsai ist nicht nur eine Modellbox. Es ist eine private Arbeitsflache fur Aufgaben, die Teams bereits an KI geben: Entwerfen, Prufen, Suchen, Vergleichen, Zusammenfassen und Vorbereiten.

Workflow bauen
Lokal gedacht

Software coding

Explain code, draft tests, review pull requests, write scripts, and search local repository notes without exposing proprietary source.

Lokal gedacht

Documents and text

Draft letters, policies, proposals, reports, summaries, tables, and structured extracts from private source files.

Lokal gedacht

Email and personal assistant

Prepare replies, classify inboxes, extract action items, create agendas, and turn meeting notes into follow-up work.

Lokal gedacht

Research desk

Compare PDFs, summarize long materials, build briefing notes, and answer questions with citations from local documents.

Lokal gedacht

Sales assistant

Prepare call notes, objection handling, proposal drafts, CRM-style summaries, and account research from approved company material.

Lokal gedacht

Compliance management

Search policies, flag missing evidence, prepare audit answers, compare obligations, and keep sensitive control documents local.

Lokal gedacht

Inventory and warehouse

Summarize stock lists, surface reorder issues, draft supplier emails, review SOPs, and answer operations questions from local records.

Lokal gedacht

Document review

Find clauses, obligations, inconsistencies, deadlines, unusual terms, and missing attachments across contracts and case folders.

Lokale KI wird schneller

Lokale KI holt auf.

Das Open-Model-Okosystem bewegt sich von reinen Modell-Releases zu Runtime-Beschleunigung: speculative decoding, Multi-Token-Prediction-Drafter, MLX, Ollama, vLLM, SGLang, Quantisierung und hardwarespezifisches Tuning. Ein selbsai Gerat ist darauf ausgelegt, von dieser Kurve zu profitieren, ohne Arbeit zuruck in die Cloud zu schieben.

Googles Gemma 4 MTP-Drafter sind ein klares Signal: offene Modelle konnen deutlich reaktionsschneller werden, wahrend das Hauptmodell die Ausgabe weiter verifiziert.

Gemma 4 MTP lesen

Schnellerer Chat

Entwurfe, E-Mail-Prufung, Dokumenten-Q&A und Assistenz-Workflows fuhlen sich besser an, wenn Token-Latenz sinkt.

Bessere lokale Agenten

Coding-Hilfen, Recherche-Schleifen und mehrstufige Workflows profitieren, wenn jeder Schritt schneller antwortet.

Modelle spater wechseln

Das Gerat ist nicht an eine Modellgeneration gebunden. Bessere offene Modelle und Runtimes konnen spater ubernommen werden.

Benchmarks ohne Show

Benchmarks ändern sich.

Das selbsai Versprechen ist nicht, dass ein kleines lokales Modell jede Frontier-API schlägt. Der Punkt ist: Viele tägliche Aufgaben brauchen diese API nicht: Entwürfe, Coding-Unterstützung, Dokumentenprüfung, interne Suche, E-Mail-Arbeit, Compliance-Workflows und private Wissensassistenz laufen auf einem Gerät unter eigener Kontrolle.

  • Premier Cloud nur nutzen, wenn maximale Frontier-Reasoning-Leistung wirklich nötig ist.
  • Lokale Open-Weight-Modelle für private, wiederkehrende und dokumentenlastige Arbeit einsetzen.
  • Modelle und Runtimes später wechseln, ohne den Kundenworkflow neu aufzubauen.
Quelle

Live-Modellranking

Für aktuelle Rankings sollte Artificial Analysis direkt genutzt werden. Das Leaderboard ändert sich, sobald neue Frontier-, Open-Weight-, Speed-, Qualitäts- und Preisdaten erscheinen.

Artificial Analysis Intelligence Index

Benchmarks ändern sich schnell; lokale Geschwindigkeit hängt von Hardware, Quantisierung, Modellwahl und Beschleunigungswegen wie MTP-Draftern, MLX, Ollama, vLLM und SGLang ab.

Open-Model-Ökosystem

Kuratierte offene KI.

Es gibt deutlich mehr Modelle, als ein normaler Käufer vergleichen sollte. selbsai filtert nach Workload, Quellenreputation, Lizenz, Runtime, Format, Hardware-Fit und Update-Politik.

Model-Card-Review

Bevorzugt werden Modelle mit klarem Einsatzzweck, bekannten Grenzen, Benchmark-Kontext und gepflegter Release-Historie.

Runtime und Format

GGUF, Safetensors, MLX, Ollama, llama.cpp und vLLM werden passend zu Gerät und Workflow ausgewählt.

Update-Politik

Kunden wählen stabile, ausgewogene oder schnelle Updates statt unerwarteter Verhaltensänderungen.

Wähle dein Problem

Wähle die Aufgabe.

Beschreibe das Problem in klarer Sprache. Wir zeigen dir die passende Einheit und die Workflows dafür — und füllen den Konfigurator vor.

Empfohlener Build

Research desk

Drop them in. Ask anything. Get answers with citations, instantly. None of it leaves the device.

Konfiguration
Obsidian Core · Professional · 2 TB · Research desk + Knowledge base
Von der Box zum Gehirn

Drei Minuten, drei Schritte. Nichts Technisches.

Wenn du einen WLAN-Drucker einrichten kannst, kannst du auch Selbs AI einrichten. Wenn du keinen WLAN-Drucker einrichten kannst — Selbs AI ist sogar leichter.

  1. 01Anschließen

    Strom und Ethernet.

    Sie bootet in unter 30 Sekunden. Keine Installationsassistenten, keine Treibersuche.

  2. 02Verbinden

    selbsai.local auf dem Laptop öffnen.

    Jedes Gerät im Netzwerk sieht sie sofort. Keine Konten, kein Cloud-Login.

  3. 03Fragen

    Fragen stellen.

    Bereits mit geprüftem Modell und deinen Workflows geladen. Von der Box zur ersten Antwort in unter drei Minuten.

Deine BrowserzeileHTTP · lokal
http://selbsai.local

Mehr ist es nicht. Die Einheit kündigt sich per mDNS im lokalen Netzwerk an. Kein Port-Forwarding, keine Zertifikate, keine DNS-Einträge.

Tägliche Kontrolle

Chatten. Steuern. Exportieren.

Nach dem Setup nutzt der Kunde selbsai über eine private lokale Browser-Oberfläche. Workflow, Dokumentenbereich und Ergebnis bleiben kontrollierbar.

Anwendungsfälle ansehen
Lokaler Browserselbsai.local
Prompt

Prüfe diesen Lieferantenvertrag und liste Zahlungsrisiken mit Quellen auf.

Entwurf bereit. Quellen angehängt. Exportieren, überarbeiten oder im Chat fortsetzen.

Bereich: Verträge / Lieferant A
Modus: Dokumentenprüfung
Output: Entwurf + Quellen
Chat

Ask from any browser

Open the local interface on your laptop, desktop, tablet, or phone and chat with the device like a normal AI assistant.

Scope

Choose what it can read

Point a question at a folder, document set, or workflow so answers come from the right local material instead of every file at once.

Mode

Switch workflows and models

Use prepared modes for coding, drafting, research, review, sales, compliance, warehouse, or general assistant work.

Output

Keep answers usable

Copy, revise, cite sources, turn answers into drafts, and keep sensitive outputs inside the local workspace until you decide otherwise.

Was geliefert wird

Was geliefert wird.

Vertrauen steigt, wenn das Angebot konkret ist. Jeder Node sollte wie ein vollständiges System wirken und nicht wie ein nackter Mini-PC mit vagen KI-Versprechen.

Konfigurierter Hardware-Node

Ein ausgewähltes Gerät, getestetes Speicherprofil, Storage und die passende Open-Model-Klasse für den gewählten Workload.

Einsatzbereiter lokaler Stack

Inferenz-Runtime, Retrieval-Tooling, Aufgaben-Presets und optionale Workflows sind vor der Auslieferung installiert.

Onboarding und Portalzugang

Ein Kundenportal, ein Upload-Pfad bei Bedarf und klare nächste Schritte von der Bestellung bis zur ersten Antwort.

Supportpfad

Menschlicher Support, Kundenportal und ein klarer Weg zu Hilfe, wenn Einrichtung oder Betrieb Aufmerksamkeit brauchen.

Wohin deine Daten gehen

Eine Strecke durch den Raum.
Statt sieben um die Welt.

Unten siehst du den tatsächlichen Weg deiner Frage — mit einem typischen Cloud-Assistenten und mit Selbs AI. Keine Metapher. Genau das passiert jedes Mal.

Cloud-Assistent
Cloud · Transit
~ 4.5 s
  1. Deine Frage
  2. Dein Router
  3. Internet-Knoten (Frankfurt → New York)
  4. Rechenzentrum des Anbieters
  5. Protokolliert & analysiert
  6. Zurück über den Atlantik
  7. Zurück zu dir
Selbs AI
Lokal · privat
~ < 1 s
  1. Deine Frage
  2. Die Box unter deinem Schreibtisch
  3. Zurück zu dir

Wenn das Internetkabel gekappt wird, arbeitet Selbs AI weiter.
Kann die Cloud das auch behaupten?

Ersparnisrechner

Einmal zahlen.

Die meisten Teams erreichen den Break-even mit Selbs AI in unter 18 Monaten. Danach ist die Intelligenz praktisch kostenlos. Bewege die Regler für deine Zahlen.

Dein Team heute
5 Personen
25 € / Monat
Monatliche Cloud-Kosten125,00 €
Cloud-Kosten über 36 Mon.4.500,00 €
Break-even — gegen Selbs AI
16Monate

16 Monaten amortisiert sich Selbs AI. Danach ist deine Intelligenz praktisch kostenlos.

Cloud über 36 Mon.4.500,00 €
Selbs AI · einmalig1.977,74 €
Referenz-BuildObsidian Core · Professional · 2 TB
Ersparnis über 36 Mon.2.522,26 €
Mein Gerät konfigurieren →

Nur Schätzung. Stromkosten (~ 1–2 € / Monat) sind ausgenommen und es wird pro aktivem Seat gerechnet.

Europäische Gewissheit

Schriftliche Zusagen.

Vertrauen ist die höchste Währung für ein Produkt wie dieses. Drei Dinge, zu denen wir uns für jeden Kunden schriftlich verpflichten.

01Schriftlich

Keine versteckten Hintertüren.

Wir nutzen Open-Weight-Modelle und veröffentlichen den Firmware-Build. Dein IT-Team, ein Auditor oder ein neugieriger Nachbar kann prüfen, was läuft.

Open Weights · reproduzierbare Firmware · veröffentlichtes SBOM
02Schriftlich

Ein physischer Kill-Switch.

Ein echter Schalter am Gehäuse trennt das Netzwerk vollständig. Air-Gap-Modus ist einen Klick entfernt — nicht in einem Menü versteckt.

Hardware-Schalter · LED-Bestätigung · keine Software-Umgehung
03Schriftlich

Lokaler menschlicher Support.

Made in Europe. Wenn etwas ausfällt, sprichst du mit den Ingenieuren, die das System gebaut haben. Kein Callcenter, kein KI-Chatbot, keine Ticket-Schlange.

Mo – Fr · 09:00 – 18:00 CET · DE / EN
Nach der Bestellung

Nach dem Checkout.

Ein hochwertiger Hardware-Kauf braucht Klarheit nach dem Kauf. Der Käufer sollte genau wissen, was als Nächstes passiert und wann Support ins Spiel kommt.

  1. 01

    Checkout und Bestätigung

    Die Bestellung wird bestätigt, der Zahlungsstatus ist sichtbar, und das Kundenportal wird zum Kontrollpunkt.

  2. 02

    Optionales Preload-Onboarding

    Falls gewählt, erhält der Kunde einen sicheren Upload-Pfad und klare Erwartungen zum Umgang mit privaten Dateien.

  3. 03

    Provisionierung und QA

    Der Node wird um den gewählten Workload herum konfiguriert, getestet und vorbereitet, bevor er das Werk verlässt.

  4. 04

    Versand und Onboarding

    Tracking, erwartete Lieferung und Onboarding-Hinweise nehmen Unklarheit aus der finalen Übergabe.

Use-Case-Appliances

Für deine Arbeit gebaut.

Jeder selbsai Build beginnt mit Beruf, Dokumenten, Risikoniveau und Betriebsgrenze. Das Modell ist nur ein Teil des Appliances.

Appliance konfigurieren
Lawyer

Typischer Workload

Contracts, case files, client memos

Was On-Premise-KI leisten kann
  • Turn every matter folder into a private, cited second brain
  • Draft first-pass letters, clauses, and timelines from your own files
  • Ask sensitive case questions without risking privilege in a cloud prompt
Warum besser als Cloud

Cloud AI can turn a simple drafting task into a privilege, vendor, and data-transfer discussion.

Doctor

Typischer Workload

Letters, notes, patient-facing summaries

Was On-Premise-KI leisten kann
  • Convert notes into clear patient letters before the next appointment
  • Find the right form, wording, or guideline while the patient is still in mind
  • Reduce evening paperwork without sending practice data to a model provider
Warum besser als Cloud

Cloud AI may save minutes, then cost hours explaining patient-data handling and access controls.

Steuerberater

Typischer Workload

Receipts, invoices, DATEV-oriented exports

Was On-Premise-KI leisten kann
  • Find the missing receipt, wrong total, or odd booking before deadline week
  • Extract invoice facts into review-ready tables instead of retyping them
  • Answer client questions from their own file history while staying audit-ready
Warum besser als Cloud

Generic cloud AI is not built around German tax confidentiality, DATEV habits, or client-file minimisation.

Architect

Typischer Workload

Specifications, tenders, site notes

Was On-Premise-KI leisten kann
  • Ask a project what changed, what is missing, and where the risk sits
  • Draft site reports, RFI answers, and tender summaries from local files
  • Keep drawings, specs, and bid material out of public AI workspaces
Warum besser als Cloud

Cloud AI can make unpublished bids, designs, and client plans feel like material you no longer fully control.

Agency

Typischer Workload

Brand voice, creative drafts, client research

Was On-Premise-KI leisten kann
  • Keep every client voice, campaign angle, and rejected idea searchable
  • Create concepts, variants, and research packs before the pitch call
  • Work on embargoed launches without training someone else's future tool
Warum besser als Cloud

Cloud AI is fast, but it can blur ownership around prompts, drafts, client strategy, and pre-launch work.

Investment, insurance & pension advisors

Typischer Workload

Suitability notes, product documents, client portfolios

Was On-Premise-KI leisten kann
  • Prepare sharper client reviews from policies, portfolios, and pension files
  • Find the clause, risk, fee, or suitability note while the client waits
  • Keep wealth, health, and family financial context inside your advisory office
Warum besser als Cloud

Cloud AI can create needless exposure around wealth, insurance, pension, and suitability records.

Works council

Typischer Workload

Policies, minutes, employee questions

Was On-Premise-KI leisten kann
  • Turn agreements, policies, and minutes into a searchable employee-rights memory
  • Prepare meeting positions from the documents everyone argues about
  • Handle sensitive workplace questions without pushing employee data into SaaS AI
Warum besser als Cloud

Cloud AI is hard to defend when employee data, monitoring concerns, and internal conflicts are in scope.

Real estate advisors & property managers

Typischer Workload

Leases, exposés, owner reports, due-diligence files

Was On-Premise-KI leisten kann
  • Ask any property folder for rent terms, obligations, deadlines, and open issues
  • Draft owner updates, tenant replies, and deal summaries in minutes
  • Review due-diligence packs without leaking pricing or transaction context
Warum besser als Cloud

Cloud AI can expose tenant, owner, pricing, and transaction context in a business built on discretion.

Käuferfragen

Vor dem Kauf.

Läuft das ohne Cloud?

Ja. Das Kernerlebnis ist dafür gebaut, lokal auf dem Gerät zu funktionieren.

Muss ich Linux oder Model Hosting verstehen?

Nein. Du sollst einen konfigurierten Node erhalten, kein Hobbyprojekt.

Für welche Aufgaben ist das wirklich gut?

Schreiben, Retrieval, Mehrsprachigkeit, dokumentenlastige Workflows und private Assistenten sind der Kern-Fit.

Was, wenn ich nach der Lieferung Hilfe brauche?

Kundenportal, Supportpfad und Onboarding-Materialien gehören zum Produkterlebnis dazu.

Build to order

Drei Entscheidungen.
Eine leise Maschine.

Wir bauen von Hand, stress-testen und versenden aus Europa. Fünf bis vierzehn Werktage, abhängig von der Konfiguration.

Made in
Europe
Standard
DSGVO-konform
Tax
MwSt-konform
Shipping
DHL · DE / AT / CH