Wittgenstein API

Całość faktów,
nie rzeczy.

„Świat jest całością faktów, nie rzeczy." Die Welt ist die Gesamtheit der Tatsachen, nicht der Dinge. — Tractatus 1.1

Problem: AI mówi nieprawdę z pewną miną — zmyśla fakty, daty i źródła, których nikt nie sprawdza. To rozwiązuje: baza faktów, w której każdy fakt ma prawdziwe źródło do kliknięcia. Zero zmyślania.

faktów w świecie
korroborowanych ≥2 źródła
encji
0 — problem

Tak AI zmyśla — i jak to wyłapać

Syntetyczne „rozszerzanie wiedzy" (EntiGraph) halucynuje — model dolepia fakty, których w źródle nie ma. Zmierzone: 74.5% dokumentów ZPE niewiernych źródłu. Realny przykład:

źródło (ZPE)

Ćwiczenie „dopasuj autora do obrazu". Podane: tytuły obrazów + pula nazwisk (m.in. Artur Grottger). Brak opisu, co obraz przedstawia. Brak przypisania autora.

syntetyk (deepseek-flash) — 🔴 niewierny

„Grottger w »Pochód na Sybir« przedstawił kolumnę powstańców, rosyjskiego oficera na koniu, dwa szczekające psy, mroźny krajobraz…" — nic z tego nie ma w źródle. Zmyślone z pamięci modelu.

✓ ten sam fakt w Wittgensteinie — wierny

„Artur Grottger namalował cykl »Pochód na Sybir«." — źródło: pl.wikipedia.org · pewność rośnie z korroboracją

1 — zasada

Fakt bez źródła nie istnieje

Inwersja problemu wierności. Zamiast generować wiedzę i filtrować halucynacje, przyjmujemy tylko fakty, które mają realne, cytowalne źródło. Prawda przybliżana przez zgodność źródeł.

1.1

Provenance obowiązkowe

Każdy fakt wchodzi z URL-em źródła i fragmentem potwierdzającym. Brak źródła → brak faktu.

1.2

Korroboracja

Ten sam fakt z niezależnej domeny podnosi pewność. „Wierny" ≠ „prawdziwy" — ale zgodne, niezależne źródła zbliżają.

1.3

Atomowość

Jeden fakt = jedno zdanie. Składowalne w grounded-QA, RAG, weryfikację.

1.4

Granice bazy

Brak dowodu ≠ fałsz — to granica naszego świata faktów. „Wovon man nicht sprechen kann…"

2 — po co

Wierna wiedza dla modeli

Część badania: jak efektywnie dodać wiedzę do istniejącego modelu. Trzy zastosowania jednej bazy.

2.1

SFT grounded-QA

Fakty z cytatami → dane treningowe bez halucynacji nauczyciela.

2.2

RAG

Wierny kontekst przy inferencji — zero treningu.

2.3

Weryfikator

Sprawdź twierdzenie wobec całości faktów.

2.4

Verifiable reward

Twardy sygnał nagrody dla RL — fakt potwierdzony albo nie.

3 — interfejs

Endpointy

GET/apimanifest + statystyki
POST/factsdodaj fakt (źródło wymagane)
GET/facts?q=&entity=&min_corroboration=szukaj
GET/facts/{id}fakt + źródła
POST/verifysprawdź twierdzenie
# zapytaj o fakt
curl localhost:8900/facts?entity=Polska

# zweryfikuj twierdzenie
curl -X POST localhost:8900/verify \
  -d '{"claim":"Kiedy Polska weszła do UE?","entity":"Polska"}'
# → supported: true, evidence: „…1 maja 2004 roku."
4 — całość faktów

Graf wiedzy

Gęsty graf — fakty łączą się przez wspólne encje. encje · fakty: ● global ● krajowy ● firmowy ● prywatny · źródła. Fakt z ≥2 źródłami świeci. Przeciągaj, najedź. Przeglądarka faktów →