SELBSAI · Ausgabe 2026

Deine KI. Dein Gerät. Deine Regeln.

Souveräne Hardware für lokale Intelligenz. Maßgeschneidert, um starke Modelle innerhalb deines eigenen sicheren Perimeters auszuführen. Keine Abos. Keine Datenlecks. Null Cloud.

Latenz: < 5 ms
Cloud-Kosten: 0 €
Datenpfad: Lokal

Beweis statt Versprechen

Vor dem Kauf.

selbsai muss mehr als nur eine gute Idee beweisen. Es braucht sichtbare Datenschutzgrenzen, realistische Fähigkeiten und echten Support, bevor ein Kunde sich bindet.

Standardmäßig privat

Die Inferenz läuft auf dem Gerät. Optionales Preload bleibt isoliert, verschlüsselt und klar begrenzt.

Local first · keine versteckte Cloud-Abhängigkeit

Leistungsfähig genug, um relevant zu sein

Der Stack wird um offene Modellklassen gewählt, die Schreiben, Retrieval, Mehrsprachigkeit und dokumentenlastige Workflows bereits gut abdecken.

7B–30B Klassen · Passung statt Hype

Ein echtes Betriebsversprechen

Menschlicher Support, DHL-Versand und ein sichtbares Kundenportal senken die Hürde, unbekannte Hardware zu kaufen.

Support · Sendungsverfolgung · Portal

Warum On-Premise

Zwei Wege, KI zu nutzen.
Nur einer gehört dir.

Die Cloud ist gemietete Intelligenz — bequem, aber nicht wirklich deine. Selbs AI ist besessene Intelligenz. Hier ist der Tausch, in klarer Sprache.

Cloud-KI

Gemietet

ChatGPT, Gemini, Claude — du fragst, die Antwort reist über das Internet zu einem fremden Server und wieder zurück.

Was du zahlst

Pro Frage, jeden Monat

Wo deine Daten liegen

Auf fremden Servern

Wie schnell es antwortet

120 – 900 ms über das Internet

Wenn das Internet ausfällt

Es funktioniert nicht mehr

Wer den Zugriff entziehen kann

Der Anbieter, jederzeit

Selbs AI

On-Premise

Im Besitz

Ein kleiner, leiser Computer in deinem Zuhause oder Büro, der direkt dort denkt. Nichts verlässt den Raum.

Was du zahlst

Ein planbarer Kauf wie ein Kühlschrank — kein Abo, das mit der Nutzung wächst.

Einmal. Dann gehört es dir.

Wo deine Daten liegen

Auf dem Gerät, bei dir

Wie schnell es antwortet

< 5 ms — lokal

Wenn das Internet ausfällt

Läuft weiter

Wer den Zugriff entziehen kann

Niemand außer dir

Warum Besitz zählt

Privat. Lokal. Deins.

Besitze den Motor.
Behalte den Kontext.

Wenn KI deine Arbeit unterstützt, verdienen dein Leben und dein Unternehmen mehr als gemieteten Cloud-Zugang. Lokale Hardware macht dieses Maß an Privatsphäre, Autonomie und Kontrolle jetzt praktikabel und bezahlbar.

Privatsphäre als Standard

Prompts, Dateien und interner Kontext bleiben innerhalb deines eigenen Perimeters, statt zu einem entfernten Anbieter zu reisen.

Spürbare Autonomie

Keine Remote-Konto-Abhängigkeit, kein Schalter bei einem Provider und keine gemietete Intelligenz zwischen dir und deiner Arbeit.

Bezahlbar genug, um zu besitzen

Ernsthafte lokale KI ist endlich als Hardware praktikabel: ein einmaliges System, das du kontrollierst, statt monatlicher Modellmiete.

Cloud-KI verlangt dauerhaftes Vertrauen. Eigene Hardware lässt dich die Regel setzen.

Alltagliche KI-Arbeit

Alltags-KI, lokal.

selbsai ist nicht nur eine Modellbox. Es ist eine private Arbeitsflache fur Aufgaben, die Teams bereits an KI geben: Entwerfen, Prufen, Suchen, Vergleichen, Zusammenfassen und Vorbereiten.

Workflow bauen →

Lokal gedacht

Software coding

Explain code, draft tests, review pull requests, write scripts, and search local repository notes without exposing proprietary source.

Lokal gedacht

Documents and text

Draft letters, policies, proposals, reports, summaries, tables, and structured extracts from private source files.

Lokal gedacht

Email and personal assistant

Prepare replies, classify inboxes, extract action items, create agendas, and turn meeting notes into follow-up work.

Lokal gedacht

Research desk

Compare PDFs, summarize long materials, build briefing notes, and answer questions with citations from local documents.

Lokal gedacht

Sales assistant

Prepare call notes, objection handling, proposal drafts, CRM-style summaries, and account research from approved company material.

Lokal gedacht

Compliance management

Search policies, flag missing evidence, prepare audit answers, compare obligations, and keep sensitive control documents local.

Lokal gedacht

Inventory and warehouse

Summarize stock lists, surface reorder issues, draft supplier emails, review SOPs, and answer operations questions from local records.

Lokal gedacht

Document review

Find clauses, obligations, inconsistencies, deadlines, unusual terms, and missing attachments across contracts and case folders.

Lokale KI wird schneller

Lokale KI holt auf.

Das Open-Model-Okosystem bewegt sich von reinen Modell-Releases zu Runtime-Beschleunigung: speculative decoding, Multi-Token-Prediction-Drafter, MLX, Ollama, vLLM, SGLang, Quantisierung und hardwarespezifisches Tuning. Ein selbsai Gerat ist darauf ausgelegt, von dieser Kurve zu profitieren, ohne Arbeit zuruck in die Cloud zu schieben.

Googles Gemma 4 MTP-Drafter sind ein klares Signal: offene Modelle konnen deutlich reaktionsschneller werden, wahrend das Hauptmodell die Ausgabe weiter verifiziert.

Gemma 4 MTP lesen →

Schnellerer Chat

Entwurfe, E-Mail-Prufung, Dokumenten-Q&A und Assistenz-Workflows fuhlen sich besser an, wenn Token-Latenz sinkt.

Bessere lokale Agenten

Coding-Hilfen, Recherche-Schleifen und mehrstufige Workflows profitieren, wenn jeder Schritt schneller antwortet.

Modelle spater wechseln

Das Gerat ist nicht an eine Modellgeneration gebunden. Bessere offene Modelle und Runtimes konnen spater ubernommen werden.

Benchmarks ohne Show

Benchmarks ändern sich.

Das selbsai Versprechen ist nicht, dass ein kleines lokales Modell jede Frontier-API schlägt. Der Punkt ist: Viele tägliche Aufgaben brauchen diese API nicht: Entwürfe, Coding-Unterstützung, Dokumentenprüfung, interne Suche, E-Mail-Arbeit, Compliance-Workflows und private Wissensassistenz laufen auf einem Gerät unter eigener Kontrolle.

Premier Cloud nur nutzen, wenn maximale Frontier-Reasoning-Leistung wirklich nötig ist.
Lokale Open-Weight-Modelle für private, wiederkehrende und dokumentenlastige Arbeit einsetzen.
Modelle und Runtimes später wechseln, ohne den Kundenworkflow neu aufzubauen.

Quelle

Live-Modellranking

Für aktuelle Rankings sollte Artificial Analysis direkt genutzt werden. Das Leaderboard ändert sich, sobald neue Frontier-, Open-Weight-, Speed-, Qualitäts- und Preisdaten erscheinen.

Artificial-Analysis-Chart öffnen Open-Weight-Trend öffnen

Artificial Analysis Intelligence Index

Benchmarks ändern sich schnell; lokale Geschwindigkeit hängt von Hardware, Quantisierung, Modellwahl und Beschleunigungswegen wie MTP-Draftern, MLX, Ollama, vLLM und SGLang ab.

Open-Model-Ökosystem

Kuratierte offene KI.

Es gibt deutlich mehr Modelle, als ein normaler Käufer vergleichen sollte. selbsai filtert nach Workload, Quellenreputation, Lizenz, Runtime, Format, Hardware-Fit und Update-Politik.

Model-Card-Review

Bevorzugt werden Modelle mit klarem Einsatzzweck, bekannten Grenzen, Benchmark-Kontext und gepflegter Release-Historie.

Runtime und Format

GGUF, Safetensors, MLX, Ollama, llama.cpp und vLLM werden passend zu Gerät und Workflow ausgewählt.

Update-Politik

Kunden wählen stabile, ausgewogene oder schnelle Updates statt unerwarteter Verhaltensänderungen.

Wähle dein Problem

Wähle die Aufgabe.

Beschreibe das Problem in klarer Sprache. Wir zeigen dir die passende Einheit und die Workflows dafür — und füllen den Konfigurator vor.

Empfohlener Build

Research desk

Drop them in. Ask anything. Get answers with citations, instantly. None of it leaves the device.

Konfiguration

Obsidian Core · Professional · 2 TB · Research desk + Knowledge base

Individuell starten

Von der Box zum Gehirn

Drei Minuten, drei Schritte. Nichts Technisches.

Wenn du einen WLAN-Drucker einrichten kannst, kannst du auch Selbs AI einrichten. Wenn du keinen WLAN-Drucker einrichten kannst — Selbs AI ist sogar leichter.

01Anschließen
Strom und Ethernet.
Sie bootet in unter 30 Sekunden. Keine Installationsassistenten, keine Treibersuche.
02Verbinden
selbsai.local auf dem Laptop öffnen.
Jedes Gerät im Netzwerk sieht sie sofort. Keine Konten, kein Cloud-Login.
03Fragen
Fragen stellen.
Bereits mit geprüftem Modell und deinen Workflows geladen. Von der Box zur ersten Antwort in unter drei Minuten.

Deine BrowserzeileHTTP · lokal

http://selbsai.local

Mehr ist es nicht. Die Einheit kündigt sich per mDNS im lokalen Netzwerk an. Kein Port-Forwarding, keine Zertifikate, keine DNS-Einträge.

Tägliche Kontrolle

Chatten. Steuern. Exportieren.

Nach dem Setup nutzt der Kunde selbsai über eine private lokale Browser-Oberfläche. Workflow, Dokumentenbereich und Ergebnis bleiben kontrollierbar.

Anwendungsfälle ansehen →

Lokaler Browserselbsai.local

Prompt

Prüfe diesen Lieferantenvertrag und liste Zahlungsrisiken mit Quellen auf.

Entwurf bereit. Quellen angehängt. Exportieren, überarbeiten oder im Chat fortsetzen.

Bereich: Verträge / Lieferant A

Modus: Dokumentenprüfung

Output: Entwurf + Quellen

Chat

Ask from any browser

Open the local interface on your laptop, desktop, tablet, or phone and chat with the device like a normal AI assistant.

Scope

Choose what it can read

Point a question at a folder, document set, or workflow so answers come from the right local material instead of every file at once.

Mode

Switch workflows and models

Use prepared modes for coding, drafting, research, review, sales, compliance, warehouse, or general assistant work.

Output

Keep answers usable

Copy, revise, cite sources, turn answers into drafts, and keep sensitive outputs inside the local workspace until you decide otherwise.

Was geliefert wird

Was geliefert wird.

Vertrauen steigt, wenn das Angebot konkret ist. Jeder Node sollte wie ein vollständiges System wirken und nicht wie ein nackter Mini-PC mit vagen KI-Versprechen.

Konfigurierter Hardware-Node

Ein ausgewähltes Gerät, getestetes Speicherprofil, Storage und die passende Open-Model-Klasse für den gewählten Workload.

Einsatzbereiter lokaler Stack

Inferenz-Runtime, Retrieval-Tooling, Aufgaben-Presets und optionale Workflows sind vor der Auslieferung installiert.

Onboarding und Portalzugang

Ein Kundenportal, ein Upload-Pfad bei Bedarf und klare nächste Schritte von der Bestellung bis zur ersten Antwort.

Supportpfad

Menschlicher Support, Kundenportal und ein klarer Weg zu Hilfe, wenn Einrichtung oder Betrieb Aufmerksamkeit brauchen.

Wohin deine Daten gehen

Eine Strecke durch den Raum.
Statt sieben um die Welt.

Unten siehst du den tatsächlichen Weg deiner Frage — mit einem typischen Cloud-Assistenten und mit Selbs AI. Keine Metapher. Genau das passiert jedes Mal.

Cloud-Assistent

Cloud · Transit

~ 4.5 s

Deine Frage→
Dein Router→
Internet-Knoten (Frankfurt → New York)→
Rechenzentrum des Anbieters→
Protokolliert & analysiert→
Zurück über den Atlantik→
Zurück zu dir

Selbs AI

Lokal · privat

~ < 1 s

Deine Frage→
Die Box unter deinem Schreibtisch→
Zurück zu dir

Wenn das Internetkabel gekappt wird, arbeitet Selbs AI weiter.
Kann die Cloud das auch behaupten?

Ersparnisrechner

Einmal zahlen.

Die meisten Teams erreichen den Break-even mit Selbs AI in unter 18 Monaten. Danach ist die Intelligenz praktisch kostenlos. Bewege die Regler für deine Zahlen.

Dein Team heute

Personen mit KI-Nutzung5 Personen

Durchschnittliche monatliche KI-Ausgaben pro Person25 € / Monat

Monatliche Cloud-Kosten125,00 €

Cloud-Kosten über 36 Mon.4.500,00 €

Break-even — gegen Selbs AI

16Monate

16 Monaten amortisiert sich Selbs AI. Danach ist deine Intelligenz praktisch kostenlos.

Cloud über 36 Mon.4.500,00 €

Selbs AI · einmalig1.977,74 €

Referenz-BuildObsidian Core · Professional · 2 TB

Ersparnis über 36 Mon.2.522,26 €

Mein Gerät konfigurieren →

Nur Schätzung. Stromkosten (~ 1–2 € / Monat) sind ausgenommen und es wird pro aktivem Seat gerechnet.

Europäische Gewissheit

Schriftliche Zusagen.

Vertrauen ist die höchste Währung für ein Produkt wie dieses. Drei Dinge, zu denen wir uns für jeden Kunden schriftlich verpflichten.

01Schriftlich

Keine versteckten Hintertüren.

Wir nutzen Open-Weight-Modelle und veröffentlichen den Firmware-Build. Dein IT-Team, ein Auditor oder ein neugieriger Nachbar kann prüfen, was läuft.

Open Weights · reproduzierbare Firmware · veröffentlichtes SBOM

02Schriftlich

Ein physischer Kill-Switch.

Ein echter Schalter am Gehäuse trennt das Netzwerk vollständig. Air-Gap-Modus ist einen Klick entfernt — nicht in einem Menü versteckt.

Hardware-Schalter · LED-Bestätigung · keine Software-Umgehung

03Schriftlich

Lokaler menschlicher Support.

Made in Europe. Wenn etwas ausfällt, sprichst du mit den Ingenieuren, die das System gebaut haben. Kein Callcenter, kein KI-Chatbot, keine Ticket-Schlange.

Mo – Fr · 09:00 – 18:00 CET · DE / EN

Nach der Bestellung

Nach dem Checkout.

Ein hochwertiger Hardware-Kauf braucht Klarheit nach dem Kauf. Der Käufer sollte genau wissen, was als Nächstes passiert und wann Support ins Spiel kommt.

01
Checkout und Bestätigung
Die Bestellung wird bestätigt, der Zahlungsstatus ist sichtbar, und das Kundenportal wird zum Kontrollpunkt.
02
Optionales Preload-Onboarding
Falls gewählt, erhält der Kunde einen sicheren Upload-Pfad und klare Erwartungen zum Umgang mit privaten Dateien.
03
Provisionierung und QA
Der Node wird um den gewählten Workload herum konfiguriert, getestet und vorbereitet, bevor er das Werk verlässt.
04
Versand und Onboarding
Tracking, erwartete Lieferung und Onboarding-Hinweise nehmen Unklarheit aus der finalen Übergabe.

Use-Case-Appliances

Für deine Arbeit gebaut.

Jeder selbsai Build beginnt mit Beruf, Dokumenten, Risikoniveau und Betriebsgrenze. Das Modell ist nur ein Teil des Appliances.

Appliance konfigurieren →

Lawyer

Typischer Workload

Contracts, case files, client memos

Was On-Premise-KI leisten kann

Turn every matter folder into a private, cited second brain
Draft first-pass letters, clauses, and timelines from your own files
Ask sensitive case questions without risking privilege in a cloud prompt

Warum besser als Cloud

Cloud AI can turn a simple drafting task into a privilege, vendor, and data-transfer discussion.

Doctor

Typischer Workload

Letters, notes, patient-facing summaries

Was On-Premise-KI leisten kann

Convert notes into clear patient letters before the next appointment
Find the right form, wording, or guideline while the patient is still in mind
Reduce evening paperwork without sending practice data to a model provider

Warum besser als Cloud

Cloud AI may save minutes, then cost hours explaining patient-data handling and access controls.

Steuerberater

Typischer Workload

Receipts, invoices, DATEV-oriented exports

Was On-Premise-KI leisten kann

Find the missing receipt, wrong total, or odd booking before deadline week
Extract invoice facts into review-ready tables instead of retyping them
Answer client questions from their own file history while staying audit-ready

Warum besser als Cloud

Generic cloud AI is not built around German tax confidentiality, DATEV habits, or client-file minimisation.

Architect

Typischer Workload

Specifications, tenders, site notes

Was On-Premise-KI leisten kann

Ask a project what changed, what is missing, and where the risk sits
Draft site reports, RFI answers, and tender summaries from local files
Keep drawings, specs, and bid material out of public AI workspaces

Warum besser als Cloud

Cloud AI can make unpublished bids, designs, and client plans feel like material you no longer fully control.

Agency

Typischer Workload

Brand voice, creative drafts, client research

Was On-Premise-KI leisten kann

Keep every client voice, campaign angle, and rejected idea searchable
Create concepts, variants, and research packs before the pitch call
Work on embargoed launches without training someone else's future tool

Warum besser als Cloud

Cloud AI is fast, but it can blur ownership around prompts, drafts, client strategy, and pre-launch work.

Investment, insurance & pension advisors

Typischer Workload

Suitability notes, product documents, client portfolios

Was On-Premise-KI leisten kann

Prepare sharper client reviews from policies, portfolios, and pension files
Find the clause, risk, fee, or suitability note while the client waits
Keep wealth, health, and family financial context inside your advisory office

Warum besser als Cloud

Cloud AI can create needless exposure around wealth, insurance, pension, and suitability records.

Works council

Typischer Workload

Policies, minutes, employee questions

Was On-Premise-KI leisten kann

Turn agreements, policies, and minutes into a searchable employee-rights memory
Prepare meeting positions from the documents everyone argues about
Handle sensitive workplace questions without pushing employee data into SaaS AI

Warum besser als Cloud

Cloud AI is hard to defend when employee data, monitoring concerns, and internal conflicts are in scope.

Real estate advisors & property managers

Typischer Workload

Leases, exposés, owner reports, due-diligence files

Was On-Premise-KI leisten kann

Ask any property folder for rent terms, obligations, deadlines, and open issues
Draft owner updates, tenant replies, and deal summaries in minutes
Review due-diligence packs without leaking pricing or transaction context

Warum besser als Cloud

Cloud AI can expose tenant, owner, pricing, and transaction context in a business built on discretion.

Käuferfragen

Vor dem Kauf.

Läuft das ohne Cloud?

Ja. Das Kernerlebnis ist dafür gebaut, lokal auf dem Gerät zu funktionieren.

Muss ich Linux oder Model Hosting verstehen?

Nein. Du sollst einen konfigurierten Node erhalten, kein Hobbyprojekt.

Für welche Aufgaben ist das wirklich gut?

Schreiben, Retrieval, Mehrsprachigkeit, dokumentenlastige Workflows und private Assistenten sind der Kern-Fit.

Was, wenn ich nach der Lieferung Hilfe brauche?

Kundenportal, Supportpfad und Onboarding-Materialien gehören zum Produkterlebnis dazu.

Volle FAQ öffnen

Build to order

Drei Entscheidungen.
Eine leise Maschine.

Wir bauen von Hand, stress-testen und versenden aus Europa. Fünf bis vierzehn Werktage, abhängig von der Konfiguration.

Made in

Europe

Standard

DSGVO-konform

Tax

MwSt-konform

Shipping

DHL · DE / AT / CH

DeineKIHardwareRegelnDeine KI. Dein Gerät. Deine Regeln.

Vor dem Kauf.

Standardmäßig privat

Leistungsfähig genug, um relevant zu sein

Ein echtes Betriebsversprechen

Gemietet

Im Besitz

Besitze den Motor.Behalte den Kontext.

Privatsphäre als Standard

Spürbare Autonomie

Bezahlbar genug, um zu besitzen

Alltags-KI, lokal.

Software coding

Documents and text

Email and personal assistant

Research desk

Sales assistant

Compliance management

Inventory and warehouse

Document review

Lokale KI holt auf.

Schnellerer Chat

Bessere lokale Agenten

Modelle spater wechseln

Benchmarks ändern sich.

Live-Modellranking

Kuratierte offene KI.

Model-Card-Review

Runtime und Format

Update-Politik

Wähle die Aufgabe.

Research desk

Drei Minuten, drei Schritte. Nichts Technisches.

Strom und Ethernet.

selbsai.local auf dem Laptop öffnen.

Fragen stellen.

Chatten. Steuern. Exportieren.

Ask from any browser

Choose what it can read

Switch workflows and models

Keep answers usable

Was geliefert wird.

Konfigurierter Hardware-Node

Einsatzbereiter lokaler Stack

Onboarding und Portalzugang

Supportpfad

Eine Strecke durch den Raum.Statt sieben um die Welt.

Einmal zahlen.

Schriftliche Zusagen.

Keine versteckten Hintertüren.

Ein physischer Kill-Switch.

Lokaler menschlicher Support.

Nach dem Checkout.

Checkout und Bestätigung

Optionales Preload-Onboarding

Provisionierung und QA

Versand und Onboarding

Für deine Arbeit gebaut.

Typischer Workload

Typischer Workload

Typischer Workload

Typischer Workload

Typischer Workload

Typischer Workload

Typischer Workload

Typischer Workload

Vor dem Kauf.

Läuft das ohne Cloud?

Muss ich Linux oder Model Hosting verstehen?

Für welche Aufgaben ist das wirklich gut?

Was, wenn ich nach der Lieferung Hilfe brauche?

Drei Entscheidungen.Eine leise Maschine.

Deine KI. Dein Gerät. Deine Regeln.

Besitze den Motor.
Behalte den Kontext.

Eine Strecke durch den Raum.
Statt sieben um die Welt.

Drei Entscheidungen.
Eine leise Maschine.