Критический рационализм

Здравоохранение — это
Эпистемологическая проблема

Хорошее объяснение сложно изменить, при этом оно продолжает объяснять то, что призвано объяснять.

Дэвид Дойч, «Начало бесконечности»

Фундаментальный недостаток современного AI для здравоохранения является эпистемологическим, а не вычислительным. Мы применяем попперианский критический рационализм - предположения и опровержения - для создания AI, который генерирует настоящие объяснения, а не вероятностные догадки.

Погрузиться в документацию
Проблема:

Индуктивная ошибка в AI для здравоохранения

Большинство AI для здравоохранения делает предсказания на основе паттернов. Но сопоставление паттернов - это не понимание.

Корреляция ≠ Причинность

Большинство AI-инструментов для здоровья путают «A обычно следует за B» с «B вызывает A»

Сопоставление паттернов находит корреляции, а не причины.

Проблема чёрного лебедя

Редкие случаи не соответствуют общим паттернам. Медицина полна редких случаев.

Индукция терпит неудачу в крайних случаях, которые важнее всего.

Легко изменяемые объяснения

Вероятностные выводы «размыты» - вы можете изменять детали, не нарушая теорию

«У вас может быть A, B или C» ничего не объясняет.

Нам не нужен ИИ, который галлюцинирует; нам нужен ИИ, который приходит к сложно изменяемым объяснениям.

Эпистемологическая основа

Критический рационализм в медицине

Мы не ищем подтверждения; мы ищем хорошие объяснения.

1
Генерировать

Предположение

Генерировать смелые объяснения состояния здоровья пациента

"Какие биологические механизмы могут это объяснить?"

2
Уничтожить

Опровержение

Систематически пытаться уничтожить каждое объяснение

"Какие доказательства убьют эту теорию? Содержат ли данные их уже?"

3
Выбрать

Отбор выживших

Выживают только объяснения, выдержавшие строгую критику

"Теории выживают, будучи сложными для изменения, а не вероятными"

Если опровергнуто, генерировать новое предположение
Критерии сложности изменения (HTV)

Что делает объяснение «хорошим»?

Хорошее объяснение - это то, которое сложно изменить, при этом оно продолжает объяснять явление.

— Дэвид Дойч, «Начало бесконечности» Основываясь на фальсификационизме Поппера
01

Взаимозависимость

Измените одну часть, и всё рухнет

Компоненты логически связаны

02

Конкретность

Делает точные, проверяемые предсказания

Не расплывчатые утверждения, а конкретные заявления

03

Лаконичность

Объясняет без произвольных предположений

Нет ad-hoc дополнений для спасения теории

04

Фальсифицируемость

Существует чёткая точка данных, которая докажет, что это неправильно

Теория делает себя уязвимой

Увидеть разницу

Плохое объяснение

Легко изменить

Вы чувствуете усталость из-за вируса.

Хорошее объяснение

Сложно изменить

Ваша усталость вызвана реактивацией Эпштейна-Барр. Вирус инфицирует B-клетки, вызывая цитокиновый ответ. Ваши повышенные печёночные ферменты (АЛТ 67) подтверждают вовлечение печени.

Каждая рекомендация в Regain оценивается по этим критериям, а не по вероятности.

Мультиагентная система

Архитектура Дебатов

Моделирование команды медиков мирового класса через состязательные дебаты

01

Агент приёма

Сформулировать проблему

Отображает состояние здоровья пациента в структурированную временную шкалу необъяснённых явлений

02

Агент предположений

Генерировать теории

Смелое генерирование гипотез: Какие биологические механизмы могут это объяснить?

Не может опровергать - только предлагать
03

Критик

Опровергать теории

Систематическое опровержение: Какие доказательства убьют каждую теорию?

Не может подтверждать — только опровергать
04

Синтезатор

Отобрать устоявшие

Выбирает теорию с наименьшим количеством противоречий

Если все опровергнуты → Протокол «Не знаю»
Если теория опровергнута: вернуться к агенту предположений

Техническая реализация

Система реализует паттерн Generator-Verifier-Reasoner (ArgMed) в рамках конечного автомата LangGraph. Теории проверяются на соответствие медицинским схемам консистентности с помощью формальной верификации.

В концепции Поппера теория, выдержавшая строгие попытки опровержения, получает условное признание - никогда не определённость, но наивысший достижимый эпистемический статус.

Эпистемическое смирение

Протокол «Не знаю»

Когда мы говорим «Я не знаю»

Критическая неудача современного AI - галлюцинации под давлением - генерация уверенно звучащих ответов, когда он не знает. Мы ставим во главу угла эпистемическое смирение.

Три триггера, активирующих IDK

1

Все теории опровергнуты

Каждое кандидатное объяснение было фальсифицировано доступными доказательствами. Не осталось выживших гипотез.

2

Одинаково легко изменяемые

Выжившие теории оцениваются одинаково по критериям сложности изменения. Ни одно объяснение не выделяется как более устойчивое.

3

Отсутствие критических данных

Дискриминирующая точка данных, которая решила бы между теориями, недоступна в текущем наборе данных.

Что происходит вместо угадывания

ВЫВОД

"Текущих знаний недостаточно, чтобы различить [Теорию A] и [Теорию B]."

ВЫВОД

"Основное узкое место - отсутствие [Конкретной точки данных]."

ВЫВОД

"Действие: Позиция наибольшей безопасности до обновления [Метрики]."

Мы не угадываем, когда не знаем.

Роль дискриминаторов

Когда теории равны, мы определяем дискриминатор - единственный тест, который убьёт одну теорию, но не другую.

Выжившие теории Дискриминатор Логика
Перетренированность против Инсулинорезистентность Утренний кортизол Перетренированность повышен; ИР норма

Определяя дискриминатор, мы направляем следующий шаг сбора данных, а не делаем необоснованные заявления.

Будущие исследования

Открытые вопросы

Проблемы, над которыми мы всё ещё работаем

1

Создание знаний vs. Извлечение

"Создают ли наши мультиагентные дебаты действительно новое знание, или это сложное извлечение, замаскированное под создание знаний?"

LLM-критик может просто извлекать контрпримеры из обучающих данных, а не генерировать настоящие контраргументы.

2

Фальсифицируемость с отложенной истиной

"В медицине истина часто проявляется через недели или месяцы."

Как вы думаете о фальсифицируемости в областях, где опровержение откладывается?

3

Сложность изменения vs. Априорная вероятность

"Есть ли согласованный способ объединить «сложность изменения» с «априорной вероятностью»?"

Или это фундаментально несовместимые эпистемологии?

4

Масштабирование опровержения

"Наш критик использует опровержение на основе схем. Какие другие механизмы опровержения мы должны рассмотреть?"

Эмпирическая фальсификация, проверка логической консистентности, экспертная оценка, петли обратной связи по результатам пациентов.

Документ

Видение и документация продукта

Изучите техническую и философскую основу попперианского движка оценки.

Мы нанимаем

Присоединиться к нашей команде

Мы ищем исследователей ИИ с глубоким интересом к эпистемологии для разработки агентной системы оценки Поппера-Дойча и её применения в здравоохранении.

Полная занятость или научное сотрудничество
Формируйте новое направление
Реальное влияние на здравоохранение
Anton Kim

Anton Kim

CEO, Regain Inc.