Усі статті
Тарас Майстер
Тарас Майстер 7 хв читання

Галюцинації ШІ у юридичній практиці: як YUST запобігає помилкам штучного інтелекту

Юрист за робочим столом перевіряє документи на моніторі
Юрист за робочим столом перевіряє документи на моніторі

Галюцинації штучного інтелекту (AI hallucinations) — вигадані посилання, хибні висновки, неіснуючі номери справ — це головний ризик для юристів, які використовують ШІ. Ми вже детально розібрали, які типи помилок допускає штучний інтелект і як на це реагують українські суди — від кваліфікації як неповаги до суду до вимоги обов’язкового людського контролю.

У цій статті розповідаємо, що ми робимо в YUST, щоб мінімізувати ці ризики — від пошуку в першоджерелах до незалежної перевірки кожної відповіді окремим ШІ-агентом. І одразу зазначимо: жодна ШІ-система у світі сьогодні не є 100% точною — тому фінальна перевірка завжди залишається за фахівцем.

Як запобігти галюцинаціям ШІ: принцип «не довіряй — перевіряй»

Більшість ШІ-інструментів працює за простою схемою: мовна модель штучного інтелекту отримує запит, генерує відповідь і відправляє її користувачу. Якщо модель «вигадала» номер справи або неправильно переказала висновок суду — ніхто цього не помітить, поки юрист не перевірить вручну.

YUST працює інакше. Кожна відповідь проходить через кілька етапів, і генерація тексту — лише один із них.

Як побудована система мінімізації галюцинацій

Крок 1: ШІ пошук по ЄДРСР у першоджерелах

Коли адвокат задає запитання, система не генерує відповідь «з голови». Спочатку спеціалізовані пошукові агенти знаходять релевантні рішення безпосередньо в ЄДРСР — Єдиному державному реєстрі судових рішень. Для практики ЄСПЛ — у базі HUDOC.

Кожне знайдене рішення завантажується повністю — не фрагмент, не анотація, а повний текст. Це принципово: щоб перевірити точність відповіді, потрібен весь документ.

Крок 2: генерація відповіді на основі знайдених рішень

Після пошуку окремий агент формує відповідь, спираючись виключно на тексти знайдених рішень. Цей агент працює за жорсткими правилами:

  • Посилатися лише на рішення, які фактично знайдені і завантажені
  • Не вигадувати номери справ, дати чи цитати
  • Використовувати тільки ті посилання на законодавство, які є в текстах самих рішень
  • До кожного рішення додавати пряме посилання на ЄДРСР

Але навіть із цими обмеженнями мовна модель може допустити помилку — переказати висновок неточно, переплутати сторони справи або приписати одному рішенню позицію з іншого.

Крок 3: незалежна перевірка другим агентом

Тут починається те, що відрізняє YUST від більшості інструментів. Згенеровану відповідь перевіряє окремий ШІ-агент — незалежний від того, який цю відповідь створив.

Цей агент-верифікатор отримує два набори даних: готову відповідь і повні тексти всіх рішень, на які вона посилається. Його завдання — порівняти одне з іншим.

Що саме перевіряється:

  • Фактична точність. Чи відповідають деталі у відповіді (сторони, обставини, висновки суду) тому, що написано в рішенні?
  • Точність цитат. Чи дійсно цитовані фрагменти присутні в тексті рішення?
  • Наявність посилань. Чи кожне згадане рішення має номер справи, дату і пряме посилання на ЄДРСР?
  • Misgrounding. Чи не приписано рішенню висновок, якого в ньому немає? Це найнебезпечніший тип помилки — коли рішення реальне, а його інтерпретація хибна.

Агент-верифікатор оцінює відповідь за шкалою і фіксує конкретні проблеми, якщо вони є.

Крок 4: виправлення виявлених проблем

Якщо верифікатор виявляє суттєві невідповідності, відповідь не відправляється користувачу. Замість цього запускається процес корекції: система виправляє конкретні проблеми, зазначені верифікатором, зберігаючи коректну частину відповіді.

Це не «перегенерація з нуля» — виправляються лише виявлені помилки. Якщо зі сторони справи все правильно, а неточність у переказі висновку — виправляється тільки висновок.

Посилання: не декорація, а інструмент перевірки

Кожне рішення у відповіді YUST містить пряме посилання на ЄДРСР або HUDOC. Це не посилання «для краси» — це можливість для юриста в один клік відкрити першоджерело і перевірити те, що написала система.

Посилання формуються на основі реальних ідентифікаторів рішень, отриманих під час пошуку — а не згенерованих мовною моделлю.

Чому 100% точності не існує — і що з цим робити

Ми могли б написати «наша система без галюцинацій» — але це було б неправдою. І ось чому.

Жодна ШІ-система у світі сьогодні не є абсолютно точною. Це стосується всіх великих мовних моделей (LLM) — від ChatGPT і Claude до спеціалізованих юридичних інструментів. За даними Стенфордського дослідження, навіть найкращі з них допускають помилки у 17–33% випадків. Різниця — у відсотку помилок і в тому, чи є механізм їх виявлення.

Наша система суттєво знижує ризик галюцинацій штучного інтелекту, але не усуває його повністю. Ось реальні обмеження:

  • Верифікатор також є ШІ. Він ефективно виявляє більшість проблем, але теоретично може пропустити помилку, яку помітить досвідчений юрист.
  • Контекст може бути неповним. Якість пошуку прямо залежить від того, наскільки детально юрист описав ситуацію. Чим точніше сформульовано запит — обставини, категорія спору, релевантні норми — тим більше шансів, що система знайде саме ті рішення, які потрібні. Ми постійно вдосконалюємо пошукові алгоритми, але допомога з боку користувача залишається важливою.
  • Еволюція практики. Позиція, яка була актуальною на момент рішення, могла бути змінена пізнішою практикою Великої Палати. Зараз система не відстежує такі зміни автоматично — але ми активно працюємо над цим.

Саме тому людський контроль залишається обов’язковим. YUST — це інструмент для професіоналів, а не заміна професіонала. Ми автоматизуємо пошук і первинний аналіз, щоб юрист міг зосередитися на тому, що вміє найкраще: критичній оцінці, стратегії та прийнятті рішень.

Як це порівняти з іншими підходами

ПідхідПошук у першоджерелахПеревірка другим агентомПосилання на ЄДРСР
ChatGPT / ClaudeНіНіНі
ChatGPT з веб-пошукомЧастково (через Google)НіЗрідка
RAG-системи загального типуЗалежить від базиНіЗалежить
YUSTТак (ЄДРСР, HUDOC)ТакТак, до кожного рішення

Що це означає для юриста

Верифікація кожної відповіді окремим агентом не робить YUST ідеальним — вона робить його значно надійнішим. Юрист отримує:

  • Відповідь, побудовану на реальних рішеннях, а не на «знаннях» моделі
  • Посилання, за якими можна перевірити кожен висновок
  • Систему, яка сама виявляє і виправляє частину помилок до того, як їх побачить користувач

Але фінальне рішення — чи використовувати знайдене рішення, чи релевантне воно до конкретної ситуації, чи актуальна позиція суду — завжди залишається за юристом. Так і має бути.

Часті запитання

Що таке галюцинації ШІ і чому вони важливі для юристів?

Галюцинації штучного інтелекту (AI hallucinations) — це коли мовна модель генерує неправдиву інформацію і подає її як факт. Для юристів це означає вигадані номери справ, хибні цитати з рішень і неіснуючі правові позиції. Українські суди вже кваліфікують подання таких документів як неповагу до суду.

Як запобігти галюцинаціям ШІ при пошуку судової практики в ЄДРСР?

Найефективніша стратегія — не покладатися на «знання» моделі, а використовувати ШІ пошук по ЄДРСР з верифікованими першоджерелами. YUST реалізує це через пошук безпосередньо в ЄДРСР, генерацію відповіді тільки на основі знайдених текстів і незалежну перевірку другим ШІ-агентом. Але навіть із багаторівневою верифікацією фінальна перевірка завжди залишається за адвокатом.

Чи може YUST повністю гарантувати відсутність галюцинацій?

Ні — і жоден ШІ-інструмент у світі зараз не може цього гарантувати. Жодна велика мовна модель не є 100% точною. YUST використовує багаторівневу перевірку, яка суттєво знижує ризик помилок, але не усуває його повністю. Кожна відповідь містить посилання на першоджерела — саме для того, щоб юрист міг перевірити висновки самостійно.

Як працює другий агент-верифікатор?

Це окрема ШІ-модель, яка не бачить процесу генерації відповіді. Вона отримує готову відповідь і повні тексти рішень, на які та посилається. Її завдання — порівняти: чи відповідає те, що написано у відповіді, тому, що фактично міститься в рішеннях. Якщо виявлено невідповідності — відповідь виправляється до того, як потрапить до користувача.

Чим YUST відрізняється від ChatGPT з посиланнями?

ChatGPT шукає інформацію через веб-пошук, який індексує мінімальну частину з 132+ мільйонів рішень ЄДРСР. YUST шукає безпосередньо в реєстрі, завантажує повні тексти рішень і перевіряє свою відповідь окремим агентом. Крім того, ChatGPT не має механізму верифікації — його відповідь ніхто не перевіряє перед показом користувачу.

Чи потрібно юристу все одно перевіряти відповіді YUST?

Так. Людський контроль (human-in-the-loop) — обов’язковий при використанні будь-якого ШІ-інструменту в юридичній практиці. YUST автоматизує пошук і первинний аналіз, але відповідальність за використання посилань у процесуальних документах несе юрист. YUST робить цю перевірку швидшою: замість ручного пошуку в ЄДРСР юрист одразу отримує релевантні рішення з прямими посиланнями.

Поділитися: