Hramadstva22

Prajekt SONORA šukaje tych, chto dapamoža «padklučyć» biełaruski hołas da BigTech

U kanale «TTS pa-biełarusku» źjaviłasia abjava ab zapusku SONORA. Heta prajekt, dzie ŭdzielniki zapisvajuć adkryty biełaruski dataset dla TTS — «kab biełaruskaja hučała naturalna ŭ sučasnych AI-servisach», piša telehram-kanał Dzik Pic.

Zdymak ilustracyjny. Fota: freepik.com

U čym prablema? Jak śćviardžajecca na sajcie, siońnia ŭ śviecie amal nie isnuje jakasnych biełaruskamoŭnych hałasavych datasetaŭ, śpiecyjalna zapisanych dla navučańnia sučasnych TTS-madelaŭ. Pry hetym u biełaruskaj movie tysiačy amohrafaŭ: adnolkavaje napisańnie, ale rozny sens u zaležnaści ad nacisku. Kali madel pamylajecca z naciskam, łamajecca i hučańnie, i sens. 

Druhaja prablema — fanietyčnaja karektnaść: miakkaść, «ŭ», «dz/dž», intanacyja i rytm:

«Bieź jakasnaha studyjnaha materyjału madeli paŭtarajuć pamyłki i hučać mienš naturalna».

Tak, siońnia ŭžo isnujuć padobnyja inicyjatyvy, naprykład, Donar.by albo madel BexTTS. Ale Sonora praciahnie ichni šlach i «vyviedzie jaho na studyjny ŭzrovień».

Tamu entuzijasty zapuścili supolnaje finansavańnie, kab «arhanizavać prafiesijny studyjny zapis biełaruskaha maŭleńnia na śpiecyjalna padabranych tekstach». Karystacca datasetam zmohuć daśledčyki, entuzijasty, startapy i adukacyjnyja inicyjatyvy.

Akramia taho, kamanda płanuje partniorstva z Google, OpenAI i ElevenLabs — «kab naš dataset uzmacniŭ ich rašeńni dla biełarusaŭ».

SONORA šukaje ciopłyja intry/pramyja kantakty ŭ:

  • Google;
  • OpenAI;
  • ElevenLabs;
  • Speechify;
  • Meta.

«Kali viedajecie kaho-niebudź u hetych kampanijach i možacie zrabić intra — napišycie, kali łaska, u pryvat, albo napišycie zvarot ad nas sami. Tekst zvarotu tut», — prosiać stvaralniki.

Vy možacie pasłuchać, jak hučyć biełaruskaja mova ŭ technałohijach siońnia, na startavaj staroncy.

Kamientary2

  • ???
    09.03.2026
    Čamu naprykład hetym nie zajmajecca Kaardynacyjnaja Rada? Ci hiendarnyja kvoty i łhbt važniej čym biełaruskaja mova?
  • Čarhovy viełasipied
    10.03.2026
    Tak a ŭ čym roźnica pamiž dadzienym prajektam i Donar.by? Donar.by ž śpiecyjalna pašyraŭ funkcyjanał Common Voice, kab byli datasety nie tolki na raspaznavańnie havorki, ale i na ahučku.

    Nu a nakont "amal nie isnuje jakasnych biełaruskamoŭnych hałasavych datasetaŭ", to naohuł chłuśnia, na adnym tolki Common Voice na dadzieny momant zapisana i pravierana 1800 hadzin ad bolš jak 8000 čałaviek. Takija vialikija datasety ŭ svabodnym dostupie mała dla jakoj movy isnujuć.

Ciapier čytajuć

Jašče adzin biełarus z vydumanaj bijahrafijaj trapiŭ pad łupu polskich rasśledavalnikaŭ17

Jašče adzin biełarus z vydumanaj bijahrafijaj trapiŭ pad łupu polskich rasśledavalnikaŭ

Usie naviny →
Usie naviny

Na treniroŭcy ŭ Rasii raźbiŭsia pierśpiektyŭny 17‑hadovy motahonščyk z Hrodna12

U Vałožynskim rajonie zahinuŭ 20‑hadovy kiroŭca — jon urezaŭsia ŭ aporu mosta2

Małady mahiloviec kasiŭ ad vojska na radzimie, a ŭ vyniku pajšoŭ vajavać za Rasiju i źnik. Maci spadziajecca, što chacia b u pałonie8

Cichanoŭskaja: My zaklikajem ZŠA nie cisnuć na Litvu nakont sankcyj26

Maskvie ŭdałosia prarvać marskuju błakadu Kuby. Čamu Vašynhton nie pierachapiŭ rasijski tankier?10

U Vilni kala Siejma Litvy ŭźniali bieł-čyrvona-bieły ściah jak znak salidarnaści ź Biełaruśsiu5

Hubarevič sprabuje ŭziać Babaryku na słabo: «Jość apasieńni, što nie atrymajecca pieraadoleć prachadny barjer na vybarach u KR?»21

«Kali ty znachodzišsia sam-nasam z saboj, chočacca raspłakacca, uspaminajučy ŭsio». Iryna Ščasnaja pra žyćcio na voli i vałanciorstva va Ukrainie1

Pradprymalnik, źviazany z atačeńniem Łukašenki, vałodaje adnym z samych darahich restaranaŭ u Vilni i hatelem u Trokach4

bolš čytanych navin
bolš łajkanych navin

Jašče adzin biełarus z vydumanaj bijahrafijaj trapiŭ pad łupu polskich rasśledavalnikaŭ17

Jašče adzin biełarus z vydumanaj bijahrafijaj trapiŭ pad łupu polskich rasśledavalnikaŭ

Hałoŭnaje
Usie naviny →

Zaŭvaha:

 

 

 

 

Zakryć Paviedamić