Výzva k předběžným tržním konzultacím - Syntéza hlasu - 2 . fáze




Datum poslední změny 23.02.2022 09:55:27

Vážení,

dovoluji si Vás touto cestou jménem Českého rozhlasu jako zadavatele pozvat k předběžným tržním konzultacím dle ustanovení § 33 zákona č. 134/2016 Sb., o zadávání veřejných zakázek, které plánujeme uskutečnit v souvislosti s připravovanou veřejnou zakázkou, jejímž předmětem plnění bude „syntéza hlasu – 2. fáze“.

Předběžná tržní konzultace bude probíhat individuálně písemnou formou.

V rámci předběžných tržních konzultací je za podmínek uvedených v ustanovení § 504 zákona č. 89/2012 Sb., občanský zákoník, možno vyhradit ze strany dodavatelů i obchodní tajemství v jejich odpovědích.

Zadavatel z odpovědí po předběžných tržních konzultacích vyhotoví souhrnný anonymizovaný protokol, který bude obsahovat stěžejní informace a který zveřejnění na svém zadavatelském profilu a zařadí jej také jako přílohu zadávací dokumentace k předmětné veřejné zakázce.

Níže uvádíme základní údaje k veřejné zakázce a naše konkrétní dotazy. Budeme velice rádi za Vaše případné odpovědi na jednotlivé otázky, které v případě zájmu prosím zašlete do 16. března 2022 na emailovou adresu: tomas.vavra@rozhlas.cz

Základní popis předmětu plnění veřejné zakázky:

Syntéza hlasu - 2. fáze

Český rozhlas (dále jen „ČRo“) má záměr zavést systém pro synteticky vytvářená audia s neurálním hlasem. Projekt by měl postupně sloužit pro načítání zpravodajských článků, servisní hlášení v aplikacích ČRo, načítání sumarizací a doporučení, načítání kratších i delších promluv do publicistických a případně i uměleckých pořadů a další využití.

Projekt je rozdělen do tří fází. V první fázi ČRo zjišťovalo možnosti a využití syntézy hlasu a tato veřejná zakázka byla již vysoutěžena a slouží testování v ČRo. Ve druhé fázi, která bude předmětem letošní veřejné zakázky, hodlá zavést syntézu hlasu pro servisní a obsahové služby v neurální kvalitě.
Ve třetí fázi ČRo uvažuje o systému s hlasy pro kreativní a uměleckou výrobu či syntetická média a vícejazyčné obsahy.

Veřejnou zakázku na 2. fázi plánujeme vyhlásit s největší pravděpodobností v období duben/květen 2022. Systém bude ČRo požadovat jako službu i dílo, tedy vybraný dodavatel by dodával administrační rozhraní pro redaktory administrátora, API, generovaná audia pro naše servery i pro redakční kontrolu obsahu a současně dodá hlasy dle požadavků ČRo / na základě našich podkladů.

Důvodem pro tržní konzultaci zaměřenou na technickou stránku syntézy hlasu jsou mnohaměsíční dodací lhůty serverů. Včasným objednáním zkrátíme termín realizace veřejné zakázky a usnadníme její průběh. ČRo v tomto „vyčkávacím“ období umožní vybranému dodavateli zavést systém na některý z testovacích serverů v interní síti, pro rychlejší ladění služby v ekosystému ČRo.

Naše dotazy v rámci předběžné tržní konzultace:

1. Jaká má být základní a doporučená konfigurace serveru pro generování audia se syntetickým neurálním hlasem v nejvyšší dostupné kvalitě?

Český rozhlas (ČRo) hodlá zavést servery do vlastní interní infrastruktury. Využití serverů se předpokládá pro generování ca 200 audií denně (v čase 5.30-24.00) v délce průměrně ca 6 minut, a to článků zpravodajského serveru a následně ad hoc syntézy dle potřeb zaměstnanců či testování servisních audií. Článková audia by měla být dostupná s jejich publikací či s krátkým zpožděním v řádu nízkých jednotek minut.

Konkrétní dotazy ke konfiguraci:

1.1. Typ požadovaného OS, verze:
a. Windows Server / Linux xx
1.2. Virtualizace:
a. pokud ji řešení používá (prosíme uvést - typ, licence)
1.3. Je nutný licencovaný SW?
a. edice
b. licence pro zajištění plné funkčnosti aplikace
1.4. Procesor:
a. počet procesorů na server
b. počet jader procesoru
c. počet vláken pokud řešení využívá multithreading
d. kmitočet v GHz
e. jiná výkonnostní kritéria
1.5. Operační paměť:
a. typ
b. konfigurace
c. velikost 16 / 32 /64 / xx GB?
1.6. Grafická karta – je nutná pro zpracování? V případě, že ano, typ a parametry.
1.7. Další hw/sw doplnění pro bezproblémový běh aplikace.
1.8. Doporučení na HA řešení vhodné pro tento typ aplikace.


2. ČRo bude zavádět mirror server stejné konfigurace pro případ výpadku. Doporučujete zapojení active / active nebo active / passive?


3. Máte vlastní doporučení k architektuře řešení nebo poznámky?

4. Dodavatel by měl zajistit výrobu, respektive natrénování, syntetického neurálního hlasu pro ČRo, který by hlas dodal v podobě nahrávek studiové kvality. Jaké všechny podklady a v jaké kvalitě by byly od ČRo vyžadovány tak, aby bylo možné hlas natrénovat a nasadit na systém dodaný pro ČRo?

Děkujeme za váš případný zájem a odpovědi na naše otázky.

S úctou
Mgr. Tomáš Vávra
Oddělení veřejných zakázek

Přílohy



žádné přílohy


Doplňující informace




žádné doplňující informace