Публикувана на: 08.07.2024
Краен срок: 12.07.2024
Прогнозна стойност: - няма установена -
Възложител: Съдийската колегия на Висшия съдебен съвет, изпълняваща функциите на Висш съдебен съвет, съгласно пар. 23, ал. 2 от ПЗР на ЗИД на КРБ
ДО
ВСИЧКИ
ЗАИНТЕРЕСОВАНИ ЛИЦА
УВАЖАЕМИ ГОСПОЖИ И ГОСПОДА,
Съдийската колегия на ВСС, изпълняваща функциите на ВСС, съгласно § 23, ал. 2 от ПЗР на ЗИД на КРБ (обн. ДВ, бр. 106/22.12.2023 г.) (СК на ВСС) планира да възложи обществена поръчка с предмет: „Поддръжка и развитие на софтуер за ускорено създаване и възпроизвеждане на актове и други документи чрез диктовка и автоматично конвертиране на гласов запис в текст (voice-to-text) и съпътстващи системи за обработка“.
1. Пълно описание на предмета на обществената поръчка:
Висшият съдебен съвет е бенефициент по процедура BG05SFOP001-3.008 „Разработка и внедряване в съдебната система на софтуер за ускорено създаване и възпроизвеждане на актове и други документи чрез диктовка и автоматично конвертиране на гласов запис в текст (voice-to-text) и съпътстващи системи за обработка“, финансирана от Оперативна програма „Добро управление“ 2014 – 2020, ДБФП № по ИСУН BG05SFOP001-3.008-0001-C01. В резултат на проекта е създадена система за ускорено създаване и възпроизвеждане на актове и други документи чрез диктовка и автоматично конвертиране на гласов запис в текст (voice-to-text) и съпътстващи системи за обработка, която е в експлоатация от 15.11.2023 г.
Необходимостта от поддръжка и развитие на софтуера се обуславя от редица предизвикателства пред системата, които не са били заложени в предишно техническо задание, както и от непрекъснатото развитие на системата.
Поради сложността на изпълнение и ангажирането на специалисти в областта на работа с невронни мрежи и разработването на изкуствен интелект , не може да се определи прогнозната стойност. Това налага и да се проведат пазарни консултации през ЦАИС ЕОП.
2. Обхват на услугата:
Дейност 1 Подобряване на точността на транскрибиране до 95%, която включва:
Дейност 1.1. Увеличаване на количеството данни
Събиране на нови данни: Събиране на нови тематични данни (аудио записи) от различни източници с помощ от ръководството на проекта от страна на ВСС. Събиране на данни от различни други източници, четене на книги и други текстове, видеа, подкасти и др.
Анотиране на данни: Анотиране на събраните данни, като се използват екипи от хора с различен езиков опит, за да се осигурят точни и висококачествени транскрипции. Използване на полуавтоматизирани инструменти за анотиране, които да се финализират от човешки анотатори.
Дейност 1.2. Увеличаване на капацитета и фина настройка на модела
Увеличаване на капацитета на модела може да стане чрез увеличаване на броя на параметрите: добавяне на повече слоеве или увеличаване броя на невроните в съществуващите слоеве. По-големите модели имат по-голяма способност да улавят сложни зависимости в данните.
Използване на по-сложни архитектури: Прилагане на по-усъвършенствани архитектури като трансформъри (Transformers), които са доказали своята ефективност в различни задачи, свързани с обработка на естествени езици. Например, модели като BERT, GPT, или по-конкретни архитектури за реч като Wave2Vec.
Фина настройка на модела: Transfer Learning: Използване на предварително обучени модели донастроени със специфични данни. Обучение с целеви данни: Фино настройване на модела с помощта на данни, които са специфични за задачата.
Дейност 1.3. Оптимизация на модела (Регуляризация)
Възможно е да се използват различни методи:
Dropout: Въвеждане на dropout в слоевете на невронната мрежа, за да се предотврати пренатоварване. Като резултат се получава модел с по-устойчиви и обобщаващи характеристики.
Batch Normalization: Използване на batch нормализация за стабилизиране на обучението и ускоряване на конвергенцията. Като резултат се получава модел с по-добри представяния на данните и подобрена точност.
L2 Регуляризация: Прилагане на L2 регуляризация, за намаляване на величината на теглата в невронната мрежа и предотвратяване на пренатоварване.
Дейност 2. Разпознаване на говорещия Speaker Recognition:
Разпознаването на говорещия (Speaker Recognition) е процесът, при който система идентифицира кой е говорителят на база на аудио данни. Тази функционалност може да бъде разделена на два основни компонента: идентификация на говорещия (Speaker Identification) и верификация на говорещия (Speaker Verification).
Събиране на нови данни с множество говорители (минимум 200 часа): Събиране на нови тематични данни (аудио записи) от различни говорители с помощ от ръководството на проекта от страна на ВСС. Събиране на данни от различно други източници, четене на книги, видеа, подкасти и др.
Анотиране на данни: Анотиране на аудио данните с информация за говорителите, включително техния уникален идентификатор.
Разделяне на данните: Разделяне на данните на тренировъчен, валидиращ и тестови набор за правилната оценка на модела.
Нормализация на звука: Всички аудио записи трябва да са с еднакво ниво на звука.
Шумоподтискане: Премахване на фоновия шум от аудио записите, за да се подобри качеството на данните.
Извличане на характеристики: Извличане на релевантни аудио характеристики (features), като Mel-frequency cepstral coefficients (MFCC), които са често използвани за задачи свързани с речта.
Дейност 3 Разпознаване на акценти и диалекти и работа повишаване на работа в шумни помещения, която включва:
Събиране на нови данни: (Минимум 800 часа) Събиране на нови тематични данни (аудио записи) от различни източници с помощ от ръководството на проекта от страна на ВСС. Събиране на данни от различно други източници, четене на книги, видеа, подкасти и др.
Разнообразие на данните: За предпочитане е да се използват източници с различни акценти и диалекти. Включване на аудио записи, направени в различни среди – от тихи офиси до шумни обществени места. Това ще помогне на модела да се научи да разпознава реч при различни нива на фонов шум. Използване на различни говорители: Осигуряване на данни от голям брой говорители, включване на хора от различни възрастови групи, полове и етнически произходи. Това ще помогне за по-доброто обобщаване на модела. Акценти и диалекти: Събиране на данни от различни географски региони, които говорят на същия език, но с различни акценти и диалекти. Това ще направи модела по-устойчив към регионални вариации в речта.
Анотиране на данни: Анотиране на събраните данни, като се използват екипи от хора с различен езиков опит, за да се осигури точни и висококачествени транскрипции. Използване на полуавтоматизирани инструменти за анотиране, които да се финализират от човешки анотатори.
Обучение и фина настройка на модела: Обучаване на модела с тренировъчните данни. Използване на техники за регуляризация, за да се предотврати пренатоварване и фина настройка на модела чрез хиперпараметрите на модела, като се използват валидиращите данни за оптимизиране на производителността.
Верификация на модела: Оценка на модела върху тестовите данни, за да се определи точността на разпознаване на говорещия. Тунинг на модела, при необходимост коригиране на модела и хиперпараметрите въз основа на резултатите от оценката.
Дейност 4 Подобряване на ефективността на негласовите модули – Потребителско приложение (4 месеца):
Детайлен бизнес анализ - проучване на потребителското поведение в системата чрез анкети и наблюдения и предоставяне на предложение за подобрения в потребителския интерфейс.
Промяна на съществуващите негласовите модули (Потребителско приложение):
Оптимизация на интерфейсите с транскрибиращия модул – има за цел оптимизация на архитектурата и повишаване на скоростта на работа на приложението.
Тестване и внедряване на промените в негласовите модули (Потребителско приложение)
Дейност 5 Други доработки свързани с промени на съществуващи функционалности, нови функционалности свързани със законодателни промени, вътрешни актове на АВСС, нови функционалности по искане на съдилищата и др. в съществуващи модули и разработване на нови и разширяване на съществуващи интеграции.
Дейност 6 Поддръжка на надградената част от системата (24 месеца, считано от предаване на изпълнената работа):
3. Пазарните консултации се провеждат на основание чл. 44 във връзка с чл. 21, ал. 2 от Закона за обществените поръчки и целят определяне на актуална прогнозна стойност на предстоящите за възлагане дейности, определена съобразно тяхната пазарна стойност към настоящия момент, без да води до нарушаване на конкуренцията и на принципите за недискриминация и прозрачност при подготовката и провеждането ѝ.
Пълното описание на техническите характеристики на предмета на поръчката и обхвата на дейностите по нея са посочени в техническата спецификация към настоящата покана (Приложение № 1 - Техническа спецификация).
Представените в настоящата пазарна консултация стойности са с индикативен характер и не са обвързващи в случай на последващо участие при откриване на процедура за възлагане на обществена поръчка по реда на Закона за обществените поръчки.
Лицата, участвали в пазарната консултации, няма да се ползват с предимство пред останалите участници.
Индикативните стойности следва да бъдат представени, съгласно Приложение № 2, в срок до 17:00 часа на 12.07.2024 г. на следните електронни адреси (задължително и на трите адреса): vss@vss.justice.bg, vssop@vss.justice.bg, it@vss.justice.bg.
Предложенията, както и всяка друга предоставена информация, ще бъдат публично достъпни в Профила на купувача в ЦАИС ЕОП.
ПРИЛОЖЕНИЕ:
1. Техническа спецификация (Приложение № 1);
2. Индикативно ценово предложение (Приложение № 2).
Регистрирайте се и се убедете сами в предимствата за Вас. 14 дневен достъп до интересуващите Ви обществени поръчки, напълно безплатно!
Регистрирайте се