Галюцинації штучного інтелекту (AI hallucinations) — вигадані посилання, хибні висновки, неіснуючі номери справ — це головний ризик для юристів, які використовують ШІ. Ми вже детально розібрали, які типи помилок допускає штучний інтелект і як на це реагують українські суди — від кваліфікації як неповаги до суду до вимоги обов’язкового людського контролю.

У цій статті розповідаємо, що ми робимо в YUST, щоб мінімізувати ці ризики — від пошуку в першоджерелах до незалежної перевірки кожної відповіді окремим ШІ-агентом. І одразу зазначимо: жодна ШІ-система у світі сьогодні не є 100% точною — тому фінальна перевірка завжди залишається за фахівцем.

Як запобігти галюцинаціям ШІ: принцип «не довіряй — перевіряй»

Більшість ШІ-інструментів працює за простою схемою: мовна модель штучного інтелекту отримує запит, генерує відповідь і відправляє її користувачу. Якщо модель «вигадала» номер справи або неправильно переказала висновок суду — ніхто цього не помітить, поки юрист не перевірить вручну.

YUST працює інакше. Кожна відповідь проходить через кілька етапів, і генерація тексту — лише один із них.

Як побудована система мінімізації галюцинацій

Крок 1: ШІ пошук по ЄДРСР у першоджерелах

Коли адвокат задає запитання, система не генерує відповідь «з голови». Спочатку спеціалізовані пошукові агенти знаходять релевантні рішення безпосередньо в ЄДРСР — Єдиному державному реєстрі судових рішень. Для практики ЄСПЛ — у базі HUDOC.

Кожне знайдене рішення завантажується повністю — не фрагмент, не анотація, а повний текст. Це принципово: щоб перевірити точність відповіді, потрібен весь документ.

Крок 2: генерація відповіді на основі знайдених рішень

Після пошуку окремий агент формує відповідь, спираючись виключно на тексти знайдених рішень. Цей агент працює за жорсткими правилами:

Посилатися лише на рішення, які фактично знайдені і завантажені
Не вигадувати номери справ, дати чи цитати
Використовувати тільки ті посилання на законодавство, які є в текстах самих рішень
До кожного рішення додавати пряме посилання на ЄДРСР

Але навіть із цими обмеженнями мовна модель може допустити помилку — переказати висновок неточно, переплутати сторони справи або приписати одному рішенню позицію з іншого.

Крок 3: незалежна перевірка другим агентом

Тут починається те, що відрізняє YUST від більшості інструментів. Згенеровану відповідь перевіряє окремий ШІ-агент — незалежний від того, який цю відповідь створив.

Цей агент-верифікатор отримує два набори даних: готову відповідь і повні тексти всіх рішень, на які вона посилається. Його завдання — порівняти одне з іншим.

Що саме перевіряється:

Фактична точність. Чи відповідають деталі у відповіді (сторони, обставини, висновки суду) тому, що написано в рішенні?
Точність цитат. Чи дійсно цитовані фрагменти присутні в тексті рішення?
Наявність посилань. Чи кожне згадане рішення має номер справи, дату і пряме посилання на ЄДРСР?
Misgrounding. Чи не приписано рішенню висновок, якого в ньому немає? Це найнебезпечніший тип помилки — коли рішення реальне, а його інтерпретація хибна.

Агент-верифікатор оцінює відповідь за шкалою і фіксує конкретні проблеми, якщо вони є.

Крок 4: виправлення виявлених проблем

Якщо верифікатор виявляє суттєві невідповідності, відповідь не відправляється користувачу. Замість цього запускається процес корекції: система виправляє конкретні проблеми, зазначені верифікатором, зберігаючи коректну частину відповіді.

Це не «перегенерація з нуля» — виправляються лише виявлені помилки. Якщо зі сторони справи все правильно, а неточність у переказі висновку — виправляється тільки висновок.

Посилання: не декорація, а інструмент перевірки

Кожне рішення у відповіді YUST містить пряме посилання на ЄДРСР або HUDOC. Це не посилання «для краси» — це можливість для юриста в один клік відкрити першоджерело і перевірити те, що написала система.

Посилання формуються на основі реальних ідентифікаторів рішень, отриманих під час пошуку — а не згенерованих мовною моделлю.

Чому 100% точності не існує — і що з цим робити

Ми могли б написати «наша система без галюцинацій» — але це було б неправдою. І ось чому.

Жодна ШІ-система у світі сьогодні не є абсолютно точною. Це стосується всіх великих мовних моделей (LLM) — від ChatGPT і Claude до спеціалізованих юридичних інструментів. За даними Стенфордського дослідження, навіть найкращі з них допускають помилки у 17–33% випадків. Різниця — у відсотку помилок і в тому, чи є механізм їх виявлення.

Наша система суттєво знижує ризик галюцинацій штучного інтелекту, але не усуває його повністю. Ось реальні обмеження:

Верифікатор також є ШІ. Він ефективно виявляє більшість проблем, але теоретично може пропустити помилку, яку помітить досвідчений юрист.
Контекст може бути неповним. Якість пошуку прямо залежить від того, наскільки детально юрист описав ситуацію. Чим точніше сформульовано запит — обставини, категорія спору, релевантні норми — тим більше шансів, що система знайде саме ті рішення, які потрібні. Ми постійно вдосконалюємо пошукові алгоритми, але допомога з боку користувача залишається важливою.
Еволюція практики. Позиція, яка була актуальною на момент рішення, могла бути змінена пізнішою практикою Великої Палати. Зараз система не відстежує такі зміни автоматично — але ми активно працюємо над цим.

Саме тому людський контроль залишається обов’язковим. YUST — це інструмент для професіоналів, а не заміна професіонала. Ми автоматизуємо пошук і первинний аналіз, щоб юрист міг зосередитися на тому, що вміє найкраще: критичній оцінці, стратегії та прийнятті рішень.

Як це порівняти з іншими підходами

Підхід	Пошук у першоджерелах	Перевірка другим агентом	Посилання на ЄДРСР
ChatGPT / Claude	Ні	Ні	Ні
ChatGPT з веб-пошуком	Частково (через Google)	Ні	Зрідка
RAG-системи загального типу	Залежить від бази	Ні	Залежить
YUST	Так (ЄДРСР, HUDOC)	Так	Так, до кожного рішення

Що це означає для юриста

Верифікація кожної відповіді окремим агентом не робить YUST ідеальним — вона робить його значно надійнішим. Юрист отримує:

Відповідь, побудовану на реальних рішеннях, а не на «знаннях» моделі
Посилання, за якими можна перевірити кожен висновок
Систему, яка сама виявляє і виправляє частину помилок до того, як їх побачить користувач

Але фінальне рішення — чи використовувати знайдене рішення, чи релевантне воно до конкретної ситуації, чи актуальна позиція суду — завжди залишається за юристом. Так і має бути.

Часті запитання

Що таке галюцинації ШІ і чому вони важливі для юристів?

Галюцинації штучного інтелекту (AI hallucinations) — це коли мовна модель генерує неправдиву інформацію і подає її як факт. Для юристів це означає вигадані номери справ, хибні цитати з рішень і неіснуючі правові позиції. Українські суди вже кваліфікують подання таких документів як неповагу до суду.

Як запобігти галюцинаціям ШІ при пошуку судової практики в ЄДРСР?

Найефективніша стратегія — не покладатися на «знання» моделі, а використовувати ШІ пошук по ЄДРСР з верифікованими першоджерелами. YUST реалізує це через пошук безпосередньо в ЄДРСР, генерацію відповіді тільки на основі знайдених текстів і незалежну перевірку другим ШІ-агентом. Але навіть із багаторівневою верифікацією фінальна перевірка завжди залишається за адвокатом.

Чи може YUST повністю гарантувати відсутність галюцинацій?

Ні — і жоден ШІ-інструмент у світі зараз не може цього гарантувати. Жодна велика мовна модель не є 100% точною. YUST використовує багаторівневу перевірку, яка суттєво знижує ризик помилок, але не усуває його повністю. Кожна відповідь містить посилання на першоджерела — саме для того, щоб юрист міг перевірити висновки самостійно.

Як працює другий агент-верифікатор?

Це окрема ШІ-модель, яка не бачить процесу генерації відповіді. Вона отримує готову відповідь і повні тексти рішень, на які та посилається. Її завдання — порівняти: чи відповідає те, що написано у відповіді, тому, що фактично міститься в рішеннях. Якщо виявлено невідповідності — відповідь виправляється до того, як потрапить до користувача.

Чим YUST відрізняється від ChatGPT з посиланнями?

ChatGPT шукає інформацію через веб-пошук, який індексує мінімальну частину з 132+ мільйонів рішень ЄДРСР. YUST шукає безпосередньо в реєстрі, завантажує повні тексти рішень і перевіряє свою відповідь окремим агентом. Крім того, ChatGPT не має механізму верифікації — його відповідь ніхто не перевіряє перед показом користувачу.

Чи потрібно юристу все одно перевіряти відповіді YUST?

Так. Людський контроль (human-in-the-loop) — обов’язковий при використанні будь-якого ШІ-інструменту в юридичній практиці. YUST автоматизує пошук і первинний аналіз, але відповідальність за використання посилань у процесуальних документах несе юрист. YUST робить цю перевірку швидшою: замість ручного пошуку в ЄДРСР юрист одразу отримує релевантні рішення з прямими посиланнями.