Искусственный интеллект на службе у Фемиды: пока миф

Логотип компании
Искусственный интеллект на службе у Фемиды: пока миф
К началу судебных мероприятий материалы дела занимали 78 томов по 250 листов каждый

Поистине, жизнь человеческая полна неожиданностей. Столкнувшись со следственно-судебной машиной, пытаясь вырваться из ее сетей, нам волей-неволей пришлось пройти все лабиринты, заглянуть во все закоулки, исследовать множество троп, чтобы выработать стратегию защиты. Конечно, ключевую роль на этом пути играет адвокат. Его владение ситуацией, скорость реагирования, информационная вооруженность столь же важны, как профессиональный опыт и квалификация.

Именно проходя этот путь одной командой – юристов и айтишников, – мы осознали, насколько беден сегодня технический арсенал российского адвоката. Тем более удивительно, что большинство задач, с которыми сталкивается в своей работе адвокат, уже реализовано в других отраслях. И те задачи, которые раньше тоже не подпадали под формализацию и автоматизацию в силу творческой интеллектуальной составляющей, сейчас уже могут быть решены с применением алгоритмов и инструментов ИИ – Искусственного Интеллекта.

Остановимся лишь на нескольких примерах и, чтобы дать читателю представление об объемах подлежащей обработке и анализу информации, будем приводить реальные цифры из (к сожалению)  реального дела.

Структуризация материалов

К началу судебных мероприятий материалы дела занимали 78 томов по 250 листов каждый!  – и это без учета вещественных доказательств, зафиксированных на электронных носителях, а также бумажных документов совокупным объемом в несколько кубометров. В ходе ознакомления было изготовлено более 20 тыс. фотокопий страниц документов. Опись, можно сказать, отсутствовала, поскольку, например, строка «Письмо 127–131», где цифры означают номера листов, не дает полезной информации.

Понятно, что без качественного разбора, распознавания (по возможности), каталогизации и структуризации всего этого объема невозможно обеспечить эффективную защиту – особенно на первых порах, когда еще нет уверенного внутреннего «навигатора» по всем материалам. Разумеется, отчасти потребуется и ручная работа (например, проставление признака значимости документа, указание корреспондентов в письмах и пр.), однако применение инструментов ИИ, обучение этой системы производить разбор позволили бы с каждым разом получать все более и более качественный результат.

Разбор обвинения

Еще одна задача, которая может быть достаточно эффективно автоматизирована, – это разбор обвинения (в терминах ИТ – технического задания на приговор, сколь бы цинично это ни звучало). И тогда тезисы выступают как требования, самостоятельные фразы, имеющие законченный простой смысл. В обвинении мы выделили их около 900. Выделение тезисов позволяет адвокату находить противоречия, недоказанные утверждения (которые можно опровергнуть), и применение алгоритмов ИИ, безусловно, ускорило бы качественный разбор обвинения.

Для последующей обработки тезисов адвокату тоже необходим инструмент, аналогичный системам управления требованиями (таким, например, как Cradle).

Классификация

Для повышения уровня управления и владения всем объемом материалов дела, с целью эффективного оперативного отбора информации для многофакторной классификации каждого тезиса и каждого документа можно применить инструмент тегирования. Тегами в простом случае могут быть ключевые аспекты обвинения, ключевые даты, события, документы и т. д. Очевидно, что в случае большого количества тегов их нужно будет объединять в классы: теги времени, теги событий и пр. А значит, чтобы существенно экономить время и получать более качественную классификацию материалов, тоже не обойтись без ИИ.

Связь материалов

На основе результатов тегирования можно построить карту связей документов, материалов, событий. Это позволит адвокату повысить управление и владение материалом, а при использовании графов в инструментах, подобных TheBrain, – визуально находить взаимосвязи, противоречия и пр.

Адвокат с подобным инструментарием становится если не «датасайнтистом», то как минимум «датамайнером».

Смысловой окрас

Эта задача уже решается, например, в системах анализа новостей. Только там выявляется, скажем, эмоциональный окрас сообщения (позитивный, негативный, нейтральный), а адвокату нужен инструмент, который бы выявлял смысловой окрас, дающий оценку или отношение материала к обстоятельствам конкретного дела («полезно для защиты», «нейтрально», «опасный документ»).

Очевидно, на первом этапе, в силу особенностей стратегии защиты в каждом процессе, подобная оценка может и должна выполняться вручную, но, как и в анализе новостей, рано или поздно рождаются алгоритмы, способные помогать и в решении такого рода задачи. При этом использование «цветовой дифференциации» по смыслу (вспомним «Кин-Дза-Дза») в совокупности с упомянутым инструментом графовой визуализации позволит одним взглядом оценить, например,  достоверность тех или иных тезисов обвинения, их доказуемость или, наоборот, опровергаемость.

Разбор допросов

При большом количестве свидетелей трудоемкость оценки доказательств увеличивается в геометрической прогрессии. Так, в нашем деле допрошено более 200 человек, что в объемах текста составляет десятки томов или более 5 тыс. страниц. Держать их в голове практически невозможно. Поэтому описанные выше инструменты – выявление тезисов, тегирование, смысловой окрас – становятся обязательными к использованию, а с применением в них ИИ-алгоритмов могут дать поистине фантастический эффект!

При работе с протоколами допросов очень пригодятся также некоторые инструменты, активно применяемые в других отраслях. Например, ссылки и упоминания – современные Wiki-инструменты уже на автоматическом уровне выстраивают перекрестные ссылки между статьями. В допросах же крайне важен инструмент ссылок между персонами: кто и в каком контексте кого упоминал. Кроме того, что это позволит качественно визуализировать связи между персонами и выстроить удобную систему навигации по допросам средствами тех же инструментов работы с графами, так еще и определить первоисточник информации, дав оценку его достоверности, и выделить ключевых свидетелей обвинения.

Еще один инструмент, который позволит оценить качество (и законность) работы следователя, – система оценки плагиата. Можно например, выявлять копируемые из допроса в допрос «показания», вычленять персону, которая впервые упомянула то или иное обстоятельство (тезис), и многое-многое другое. Системы поиска и оценки плагиата, снабженные возможностями анализа пересечений и совпадений, тоже не смогут обойтись без ИИ.

Поиск противоречий

Возвращаясь к «наложению» задач выявления тезисов, тегирования, смыслового окраса и разбора материалов допросов, напрашивается идея использования инструмента поиска противоречий. Так, взяв какой-либо тезис обвинения, мы относим его к определенному классу, навешиваем на него определенные теги, каждый из которых имеет смысловой окрас. То есть мы видим, есть ли какие-либо иные объекты (документы, вещдоки, протоколы допросов и пр.), которые в этом теге имеют окрас «полезно для защиты». По сути это и будет выявленное потенциальное противоречие.

Очевидно, в этой задаче тоже напрашивается необходимость ИИ-алгоритмов. Причем на первом этапе совсем несложных.

Протоколирование

В ходе процесса мы столкнулись с низким качеством протоколирования самого судебного процесса (уж очень не хочется закладывать здесь чей-то умысел). В целом за 2,5 года состоялось более 200 заседаний суда. В итоге мы имеем более тысячи часов аудиозаписей (естественно, стороной защиты они тоже велись) и более 6 тыс. листов бумажных протоколов судебных заседаний. Ознакомление с протоколами только 25 заседаний привело к формированию более чем 300 существенных замечаний – сутевых, влияющих на принятое судом решение. Таким образом, инструмент в «технической обвязке» адвоката, позволяющий разобрать стенограмму, а затем составить реестр разногласий между ней и оформленным протоколом судебного заседания, станет мощнейшим подспорьем защиты.

Но сегодня именно эта часть «системы будущего» для адвокатов видится наиболее сложной в плане реализации. Да, системы распознавания голоса растут сейчас как грибы. Но перевод аудиозаписей в текст и техническая сверка текстов – всего лишь первая часть работ, ресурсоемкая с точки зрения временных затрат на, в общем-то, несложные операции. А вот вторая часть – включающая анализ расхождений, определение их критичности, формирование сутевых замечаний, – требует глубокой аналитики, в том числе на предмет полезности и применимости выявленных противоречий к выбранной стратегии защиты.

Подведем небольшой итог

Правовое государство можно строить тогда и только тогда, когда в нем главенствует закон. А верховенство закона заключается в двух основных вещах: неотвратимости наказания и его законности.

Задача обеспечения законности наказания ложится прежде всего на плечи судей и адвокатов. И если у первых за спиной вся мощь следственно-судебной машины, то у вторых... только профессионализм и опыт.

На наш взгляд, именно всесторонняя технологическая поддержка адвоката с опорой на искусственный интеллект постепенно сделает бессмысленным раздувание дел – когда за объемом материалов теряется суть или маскируется ее отсутствие. Ну, а для начала ИИ для адвоката поможет Фемиде оставаться беспристрастной и не подглядывать через свою повязку.

 

Опубликовано 22.03.2019

Похожие статьи