ACL 2020 Student Research Workshop paper is now out

Sjá íslenska þýðingu neðar

Last week ACL hosted their 2020 ACL conference. It was supposed to be in Seattle, Washington. But due to COVID-19 it has been moved online, including their satellite events like the ACL 2020 Student Research Workshop (SRW).

This means their proceedings have now been published, including a paper by our very own student, Steinþór Steingrímsson: Effectively Aligning and Filtering Parallel Corpora under Sparse Data Conditions. He wrote about his methods for preparing parallel text for machine translation.

Í síðustu viku hélt ACL árlegu ráðstefnuna sína. Upprunalega átti að halda ráðstefnuna í Seattle en vegna COVID-19 var hún öll færð yfir í netheima, einnig vinnustofur eins og ACL 2020 Student Research Workshop (SRW).

Þetta þýðir að allar innsendar greinar hafa verið gefnar út, þar á meðal grein eftir nemenda okkar Steinþór Steingrímsson. Heiti greinarinnar er Effectively Aligning and Filtering Parallel Corpora under Sparse Data Conditions. Þar skrifar Steinþór um aðferðir til að undirbúa samhliða texta fyrir vélþýðingu.

Abstract

Parallel corpora are key to developing good machine translation systems. However, abundant parallel data are hard to come by, especially for languages with a low number of speakers. When rich morphology exacerbates the data sparsity problem, it is imperative to have accurate alignment and filtering methods that can help make the most of what is available by maximising the number of correctly translated segments in a corpus and minimising noise by removing incorrect translations and segments containing extraneous data. This paper sets out a research plan for improving alignment and filtering methods for parallel texts in low-resource settings. We propose an effective unsupervised alignment method to tackle the alignment problem. Moreover, we propose a strategy to supplement state-of-the-art models with automatically extracted information using basic NLP tools to effectively handle rich morphology.

You can check out the paper on the ACL website: https://www.aclweb.org/anthology/2020.acl-srw.25/

Seattle photo via Good Free Photos

Learn about our TTS process as described by Atli Thor

At the end of June 2020, Atli Thor Sigurgeirsson went on the local Icelandic radio station Rás 2 to give an interview about the state of our text-to-speech synthesis and data collection process. As this was an interview with Síðdegisútvarpið the interview is in Icelandic.

Description from Rúv: Við forvitnumst um nýjan talgervil sem er í þróun hjá Háskólanum í Reykjavík. Atli Þór Sigurgeirsson er umsjónarmaður þess verkefnis hann kemur til okkar.

Practical information about the radio program is below:

Name of show: Síðdegisútvarpið
Station: Rás 2
Date: 26. 06. 2020
Air time: 16:30
Interviewer: Guðmundur Pálsson
Duration: approximately 10 minutes
Topics discussed: The work carried out at LVL, specifically w.r.t. speech synthesis and speech data collection
Language of interview: Icelandic
Interviewee: Atli Thor Sigurgeirsson

The full episode is available at ruv.is. However, we have also extracted and transcribed the interview. They are both available below. The transcription was made by the ASR at tal.tiro.is with minor edits and diarization added.

íslenska frá MT okkur: Í heild sinni er aðgengilegt á ruv.is. Hins vegar höfum við einnig dregin út og yfirfærð á viðtalinu. Þau eru bæði fyrir hendi hér. Umritun var tekin af ASR á tal.tiro.is með minniháttar breytingar og diarization bætt við.

Fréttir, fróðleik og tónlist. Síðdegisútvarpinu á Rás 2.
Talgervill: Komið þið heil og sæl, og velkomin í Síðdegisútvarpinu.
Guðmundur Pálsson: Þetta er sem sagt nýr íslenskur talgervill sem talar þarna og þetta er hluti af mjög viðamiklu verkefni sem að það snýst um að þjálfa tauganets módel, sem kunni að tala. Hann er kominn til okkar, Atli Þór Sigurgeirsson, sem er Hvað húsið umsjónarmaður, þessa verkefnis eða hvað?
Atli Thor Sigurgeirsson: Já ég hér sé um þetta verkefni á haskólunam.
Guðmundur Pálsson: Og hvað erum við að hlusta á hana? Um hvað snýst málið? Við höfum heyrt talgerla talað áður.
Atli Thor Sigurgeirsson: uhm
Guðmundur Pálsson: og þá. Það var alveg ágætt og ekkert ekkert ofboðslega sannfærandi kannski. Erum við að taka næsta skref?
Atli Thor Sigurgeirsson: Já. Þetta- Þessi tegund af talgervlum módelum komu til sögunnar fyrir þremur árum síðan, og módelin sem við þekkjum til dæmis inn á rúv.is spilar sem sjóndaprir getað notað til að lesa fréttir. Það er önnur tegund af talgervlum sem hefur verið mikið notuð, og þeir talgervla gervlar virka þannig að þeir klippa mikið af gögnum niður, taka þeir litlar einingar og púsla þeim aftur saman. Vandamálið með þannig talgervla er að maður heyrir samskeytin þegar þeir tala eins og þegar tveir litlir hljóðkútar hefur púslað saman. þessi tegund, á módeli talgervilið verka öðruvísi vegna þess að hann býr til sjálfur, klippir ekki hljóðið og finnur það í gagnasetti sem býr til hljóðið, að þegar svona módel fara heyra helling af þjálfun á gögnum, mód-módelið sjálft það keyrir í gegnum fimmtán þúsund þjálfunar setningar sem manneskja hefur setið í hljóðveri og hlustað á í hvert skipti sem að fara að heyra setningu verður mótið aðeins betra í að skilja hvernig textinn breytist í tal módelið. Þá fara að sjá textann til dæmis, Halló, ég heiti Atli. og svo hljóðið sem röddin sem sat í hljóðverinu bjó til þegar hún las setninguna: Fyrst var hún ekki mjög röddin, ekki mjög góða skilja hvernig átti að segja, Halló, en þegar hún kannski búnir að sjá orðið halló fimmtíu sinnum
Guðmundur Pálsson: Já.
Atli Thor Sigurgeirsson: þá var orðinn ansi góðir.
Guðmundur Pálsson: Það er nefnilega halló
Atli Thor Sigurgeirsson: Já.
Guðmundur Pálsson: um hinn eiginlega fyrsta drafaðan, eitthvað hálf þreytt, þreyttur talgervill sem var að tala.
Atli Thor Sigurgeirsson: Einmitt.
Guðmundur Pálsson: að heyra hvernig þróunin var síðan.
Talgervill: að þetta í frétt allir er þetta allir. Hvað er eiginlega að frétta? Halló allir. Hvað er eiginlega að frétta? Halló allir. Hvað er eiginlega að frétta? Halló allir. Hvað er eiginlega að frétta? Halló allir. Hvað er eiginlega að frétta?
Guðmundur Pálsson: Já, þetta eru eggin smámunur frá þarna í byrjun þar sem maður er bara eitthvað svona. Hann segir óskiljanlegt eitthvert rugl.
Atli Thor Sigurgeirsson: Bara Er einhver læti í bakgrunninum? Já, þetta er hérna. Maður heyrir rosalega mikið. Sko þarna undir lokin að þar fer svona blæbrigði raddarinnar sem sat í hljóðverinu kom í ljós þetta módel, var sem sagt búið að þjálfa á tölvu sem við erum með niður í Háskóla Reykjavíkur í níu daga, minnir mig, fyrsta daginn sem sagt fyrsta hljóði sem við heyrðum var að spila eftir hálfan dag. urðum við næstu næsta, var bara eftir einn dag, svo seinasta var eftir níu daga. Það var eitthvað mikið sem gerðist þarna á milli dags, átta og níu vandamálið fyrir okkur getur stundum verið að þessi módel eru það flókin að það getur verið erfitt fyrir okkur að vita nákvæmlega hvað módelið er að gera hverju sinni, af hverju það var svona mikil breyting skyndilega á áttunda degi miðað við alla dagana á undan. Þetta snýst bara rosalega mikið um að módelið er að skoða gögnin og það er að reyna bara það sem við gerum með módelið er að það býr til útkomna, það giskar og ég held að þessi setning eiga eigi hljómar svona: sýnum við módelinu? Nei, nei. Það á að hljóma svona sínum venjum sínum, módelinu, hvernig setningin var í raun og veru borið fram. Berum saman sýnaspá og raunveruleikann, segir: ókei. Ég þarf aðeins að færa til hérna, þetta var aðeins meira svona hægt og rólega. Þá þá verður röddin náttúrulegri og líkari raunverulegur röddinni.
Guðmundur Pálsson: Einmitt. Og hvernig-hver er tilgangurinn með, eins og við heyrum oft einmitt þörf á því að Ísland íslenskan einhvern veginn þróist með þessum tæknibreytingum eða ekki. Tungumálið þróist ekki heldur tækniþróuðust með tungumálinu þannig að það sé hægt að nota af
Atli Thor Sigurgeirsson: Akkurát.
Guðmundur Pálsson: Maður heyrir náttúrlega börn tala ensku við tæki nú þegar. Er þetta liður í því einhvern veginn að bregðast við þessum breytingum.
Atli Thor Sigurgeirsson: Klárlega, að við höfum mikinn áhuga á að gera íslensku gjaldgenga í stafræna heiminum og að Íslendingar geti notað tækin sín á íslensku. Svona eitt af markmiðum í talgervingu er líka sem sagt. Þá er einn af markhópunum okkar eru sjóndapri því það eru margir sjónvarpið sem nota talgervla til að nota tölvur og skoða vefsíður og svo framvegis. En svona langtíma markmið hjá okkur líka er að stóru tækni risarnir, geti mögulega notað þessi gögn, eins og Google með Google assistant eða Apple með Siri eða Amazon með Alexu að þau fara að búa til íslenskar raddir sem geta talað við okkur og svarað spurningunum okkar og skilið spurninguna okkar. Við bíðum spenntir eftir því.
Guðmundur Pálsson: Já Er nú talað um að Ísland sé lítið markaðssvæði, einhvern veginn svona breytingar, einhvern veginn og þess háttar séu lengi að einhvern veginn skila sér hingað og við erum ekki efst á listanum kannski en en eru einhvern veginn tæknin orðin þannig og með þessu. Þetta er gervigreind einhvern veginn að verða miklu hraðari og erum við bara að tala um einhvern veginn? Er hún komin yfir einhvern þröskuld? Þá er þetta bara mjög einfalt mál, einhvern veginn að tengja þetta einhvern veginn við tækin eins og hvað annað?
Atli Thor Sigurgeirsson: Já, í raun og veru, kannski bara fyrst varðandi þurft þessa staðsetningu okkar í heiminum. Við erum lítið málsvæði og oft eru tungumáli okkar ekki stutt tækninni hefur verið tekið virkilega vel tekið í þetta erlendis og mikið fylgst með okkur máltækni áætluninni, áætlanir sem við vinnum eftir og hvað við höfum verið framarlega miðað við hvað við erum fá. En varðandi tæknina þá já, þá hefur hún svolítið breyst undanfarin ár að þetta hefur verið að færast meira og meira yfir í gervigreind og sem sagt gömlu módelin voru notuð. Þau þurftu rosalega mikið af sérstakri þekkingu sem kannski mjög fáir bjuggu yfir til að búa til módelin og hannaði. Núna er þetta farið að vera meira svona almenn gervigreind sem þeir sem taka til dæmis reiknigreindar áfanga í háskóla í meistaranámi geta komið inn í og sem sagt að mínu mati, gervigreind og reiknigreind mjög framarlega í máltækni á Íslandi erum við að beita henni í að hafa raunverulegar breytingar. Það er mjög spennandi fyrir þá sem hafa áhuga á gervigreind og reiknigreind þetta svið, máltækni.
Guðmundur Pálsson: Um Þetta er runnið, þú ert í Háskólanum í Reykjavík.
Atli Thor Sigurgeirsson: Já
Guðmundur Pálsson: og þetta hefur unnið hér að hluta hér innan húss hjá Rúv
Atli Thor Sigurgeirsson: Já
og nú yrði að fara. Er það ekki í eitthvert ferðalag að sækja?
Atli Thor Sigurgeirsson: Já. Við verðum að fara sem sagt: við tökum upp átta raddir í heildina, tuttugu klukkutíma á um öllum ræddum þannig að hundrað og sextíu klukkutíma heildina. Sex raddir voru teknar upp hérna fyrir sunnan. Nokkuð langar að bæta við tveimur norðlenskum röddum og þá ætluðu að fara að taka upp í Háskólum í á Akureyri byrjun þar bara á mánudaginn. Þá erum við að leita að karli og konu og það væri bara ótrúlega góð viðbót í þetta safn á röddum sem við erum komin með núna. Já, okkur hlakkar til að kíkja norðurs.
Guðmundur Pálsson: Já, yrðu er búið að velja fólk til að lesa eitthvað svona?
Atli Thor Sigurgeirsson: Já, við, við vorum að velja bara í dag.
Guðmundur Pálsson: Fólk er ekki, ekki biðröð. Hann var að vanda mig við.
Atli Thor Sigurgeirsson: Við eigum fyrst að reyna að hafa samband norður og gekk frekar erfiðlega, fengum lítið litla svörun þetta inn á einhverja tvo, þrjá fjölmiðla, árnar fyrir norðan og þá bara hrundi og mikill áhugi.
Guðmundur Pálsson: Já. Það byrjar á mánudaginn.
Atli Thor Sigurgeirsson: Já við erum með einar rödd frá Ólafsvík og svo vorum við með eina frá Akureyri.
Guðmundur Pálsson: um það. Atli Þór, takk fyrir þetta. Já. Þetta er mjög skemmtilegt verkefni. Gangi ver vel í verkefni og takk talgervill fyrir hjálpina líka.
Talgervill: Takk sömuleiðis. Við skulum heyra lag með sálinni hans Jóns míns
Tónlist: í dag, hugleysi hvernig lífi.


TTS, Language Technology, Kvistur, and Samrómur papers published but no conferences to attend

Sjá íslenska þýðingu neðar

This is a positive but somewhat sad week for LVL. Many LVL members were going to go to Marseille, France this week to attend Language Resources & Evaluation Conference (LREC) 2020 and the joint Spoken Language Technologies for Under-Resourced Languages and Collaboration and Computing for Under-Resourced Languages (SLTU-CCURL) 2020 Workshop. Once there they were going to present their many papers, providing an in-depth look into our TTS, data collection, compound splitting, and general language technology research in recent months. However, due to COVID-19 these conferences were both cancelled. Luckily the organizers have still decided to publish the proceedings this month. The joint SLTU proceedings were published May 8th on the SLTU-CCURL 2020 website at Workshop Proceedings (our paper is on page 316). Head over to the SLTU 2020 website if you want to read more SLTU-CCURL papers. We’re still waiting for the LREC proceedings to be published. But our papers can now be found as pdfs below and on our publications page.

Our TTS paper was accepted at SLTU-CCURL 2020:



Title: Manual Speech Synthesis Data Acquisition – From Script Design to Recording Speech
Authors: Atli Þor Sigurgeirsson, Gunnar Thor Örnólfsson, Jon Gudnason
Summary: In this paper we present the work of collecting a large amount of high quality speech synthesis data for Icelandic. A script design strategy is proposed and three scripts have been generated to maximize diphone coverage, varying in length. The largest reading script contains 14,400 prompts and includes 81% of all Icelandic diphones at least twenty times. As of writing, 58.7 hours of high quality speech data has been collected.
PDF

Our Samrómur, Kvistur, and Language Technology programme papers were accepted at LREC 2020:

The cover of the proposal sent to the Icelandic parliament

Title: Language Technology Programme for Icelandic 2019-2023
Authors: Anna Nikulásdóttir, Jón Guðnason, Anton Karl Ingason, Hrafn Loftsson, Eiríkur Rögnvaldsson, Einar Freyr Sigurðsson and Steinþór Steingrímsson
Summary: In this paper, we describe a national language technology programme for Icelandic. The programme aims at making Icelandic usable in communication and interactions in the digital world, by developing accessible, opensource language resources and software. The research and development work within the programme is carried out by SÍM, a consortium of universities, institutions, and private companies, with a strong emphasis on cooperation between academia and industries. Five core projects will be the main content of the programme: language resources, speech recognition, speech synthesis, machine translation, and
spell and grammar checking.
PDF

A representation of the model with one BiLSTM layer, showing where the compound word raforku ‘electric energy’ is split in two.

Title: Kvistur: a BiLSTM Compound Splitter for Icelandic
Authors: Jón Daðason, David Mollberg and Hrafn Loftsson
Summary: In this paper, we present a character-based BiLSTM model for splitting Icelandic compound words, and show how quantity of training data affects model performance. Compounding is highly productive in Icelandic, and new compounds are constantly being created. This results in a large number of out-of-vocabulary (OOV) words, negatively impacting the performance of many NLP tools. Our model is trained on a dataset of 2.9 million unique word forms and their constituent structures from the Database of Icelandic Morphology. The model learns to split compound words into two and can be used to derive a word form’s constituent structure. Knowing the constituent structure of a word form makes it possible to generate the optimal split for a given task. The model outperforms other previously published methods when evaluated on a corpus of manually split word forms. This method has been integrated into Kvistur, an Icelandic compound word analyzer.
PDF

The cumulative count of votes and utterances. Each utterance can have more than one vote as it needs two positive votes to be considered valid and two negative votes to be considered invalid.

Title: Samrómur: Crowd-sourcing Data Collection for Icelandic Speech Recognition
Authors: David Erik Mollberg, Ólafur Helgi Jónsson, Sunneva Þorsteinsdóttir, Steinþór Steingrímsson, Eydís Huld Magnúsdóttir and Jon Gudnason
Summary: This contribution describes an ongoing speech data collection, using Samrómur which is built upon Mozilla’s Common Voice. The goal is to build a large-scale speech corpus for Automatic Speech Recognition (ASR) for Icelandic. Upon completion, Samrómur will be the largest open speech corpus for Icelandic. The paper discusses the methods used for crowd-sourcing and illustrate the importance of marketing and good media coverage for a crowd-sourced dataset. Preliminary results exceed our
expectations. The paper also reports on the process of validating recordings.
PDF

Our SÍM colleagues also had two papers at LREC 2020: “Facilitating Corpus Usage: Making Icelandic Corpora More Accessible for Researchers and Language Users” and “Parallel Universal Dependencies”. Congratulations!

While it is sad that our LVL members cannot meet with fellow researchers and visit the great city of Marseille, they still look forward to connecting with researchers online through your comments on their papers and links to your related papers.

Þessa vikuna hefði átt að halda Language Resources & Evaluation (LREC) ráðstefnuna í Frakklandi, sem og Spoken Language Technologies for Under-resourced Languages vinnustofuna en báðum þessum viðburðum var aflýst vegna COVID-19.  Margir starfsmenn LVL ætluðu sér að sækja þessa viðburði og kynna þar 4 greinar og veita innsýn í þær máltæknirannsóknir sem hafa farið fram hérna síðustu mánuði. Hérna má lesa nánar um þetta og nálgast greinarnar. (Athugið að greinarnar eru aðeins aðgengilegar á ensku).

Donate your voice to bring Icelandic and technology together!

Hello everyone!

We are collecting audio clips to create a new, more robust Icelandic dataset. We plan to use them for automatic speech recognition and text-to-speech applications. This could lead to many applications that you can use in your everyday life, like an Icelandic voice assistant, screenreaders, and searchable audio and video content. The dataset will soon be available directly on the Samromur website for users and developers alike to download and use to creating exciting new technology. But to do this, we need your voices, Icelandic speakers.

You can get started by going to Samromur.is  and choosing Tala. You only need to donate 5 recordings per session, but more is always welcome. If you want to do more, you can also evaluate clips made by other users with Hlusta.

Samromur

 

We are also organizing data gathering competitions within companies. So, please contact us if you and your company would be interested in holding a competition.

This is a joint effort with Deloitte and Almannaromur. If you want to learn more about this project, visit the Um Verkefnið tab on the Samromur site.

Tune in this weekend as Rás 1 interviews ASR expert Inga Rún and Althingi editor, Steinunn about the Icelandic Parliament’s automated transcription system.

September 2019 signals the end of the LVL automatic speech recognition, ASR, project with Althingi, the Icelandic parliament. To close, the radio station Rás 1 is airing an interview September 8 at 9:30pm (21:30). The interview is conducted by the head of the Althingi speech department, Berglind Steinsdóttir. In the interview, Berglind talks to both Inga Rún, our ASR expert, and Steinunn, an Althingi editor. They discuss both sides of the project: software development and user experiences. This broadcast will hopefully give our Icelandic readers and listeners a deeper understanding of the specifics involved in ASR. Thus, we invite you to tune in this Sunday at 21:30.

Practical information about the radio program is below:

Date: Sunday, September 8th @ 21:30 (re-airing Saturday, September 14th 20:45)
Location: Rás 1 website or the radio station
Duration: 30 minutes
Title: “Háttvirtur þingmaður tekur til máls”
Topic: Sjálfvirknivæðing. Gervigreind. Fjórða iðnbyltingin. Hvað kemur þetta ræðum þingmanna við? Tekinn hefur verið í notkun talgreinir sem skrifar upp ræður þingmanna og í þættinum er rætt við Ingu Rún Helgadóttur eðlisfræðing sem hefur tekið þátt í að þróa hann og Steinunni Haraldsdóttur íslenskufræðing sem hefur notað talgreininn.
Language of Interview: Icelandic
Interviewees: Inga Rún Helgadóttir, ASR developer
Steinunn Haraldsdóttir, icelandic specialist who uses the ASR
Interviewer: Berglind Steinsdóttir
Supervisor: Ásdís Emilsdóttir Petersen.

During the interview go to https://ruv.is/ras1 Click on Í BEINNI. Select Rás 1 and press the play button.

Acceptances Galore

This has been a great summer for LVL. We have many conference acceptances: 8 papers, 3 conferences. It will also be a busy autumn, as all the conferences are in September.

Our first is Recent Advances in Natural Language Processing, a very competitive NLP conference. This year it is in Varna, Bulgaria. Steinþór, Örvar and Hrafn’s paper, “Augmenting a BiLSTM tagger with a Morphological Lexicon and a Lexical Category Identification Step” and Hrafn’s paper “A Wide-Coverage Context-Free Grammar for Icelandic and an Accompanying Parsing System” will both be presented.

Next is Interspeech in Graz, Austria. We have four papers:

  • Yu-Ren Chien – “F0 Variability Measures Based on Glottal Closure Instants”
  • Inga Helgadóttir – “The Althingi ASR System”
  • Anna Rúnarsdóttir – “Lattice re-scoring during manual editing for automatic error correction of ASR transcripts”
  • Anna Nikulásdóttir – “Bootstraping a Text Normalization System for an Inflected Language. Numbers as a Test Case”
InterSpeech_2019_Althingi
poster describing “the Althingi ASR System”

To wrap up the month, we will be attending the 22nd Nordic Conference on Computational Linguistics (NoDaLiDa) in Turku, Finland. We will be representing two papers by Svanhvít Ingólfsdóttir: “Nefnir: A high accuracy lemmatizer for Icelandic” and “Towards High Accuracy Named Entity Recognition for Icelandic.”

All these acceptances exemplify our successful push to increase language technology for Icelandic.

Note: For more details about the papers, please go to our Publications page.

2019 Rannis Grants

Rannis (The Strategic Research and Development Programme for Language Technology) has awarded Hrafn two grants this year. Congratulations! The first project, Automatic Text Summarization (ATS) for Icelandic, will be worked on by a post-doctoral researcher and an Icelandic linguist in collaboration with mbl.is, Morgunblaðið’s news website. The second one is Named Entity Recognition (NER) for Icelandic. Svanhvít Lilja Ingólfsdóttir and Ásmundur Guðjónsson, two students from the Language Technology (Máltækni) masters program will work on the NER project in collaboration with the Icelandic Stock Exchange. Welcome to LVL!

Anna Björk has also been awarded a grant, for her company, Grammatek ehf., in cooperation with the city of Akranes. Congratulations and we wish you all the best with your new endeavor!

More information regarding the ATS post-doctoral research position can be found at https://lvl.ru.is/jobs.

 

 

Can stress be measured?

For the past few years, Eydís has been looking into it. She did a cross analysis on different measurements of cognitive workload with respect to the Icelandic flight industry. Cognitive workload, for the purposes of this article is synonymous with stress. The research indicates there are clear differences in measurements when an individual is rested or stressed. While the research focused on individuals in the aviation industry, the results can be applied to all people.

So, the answer to “Can stressed be measured?” is yes, most definitively. To get a more in-depth explanation of the indicators of stress, please read Eydís’ PhD thesis here

For more on the topic, read it here in Icelandic: https://www.ru.is/haskolinn/frettir/maeldi-alagseinkenni-i-tali

This research has been done in collaboration with ISAVIA and Icelandair.

SLT 2018 here we come!

This year we’re branching out and attending a smaller conference, IEEE SLT 2018!

We will be presenting the results from our paper, “An Icelandic Pronunciation Dictionary for TTS.” The work was done in collaboration with the linguist and Icelandic specialist, Eiríkur Rögnvaldsson from the University of Iceland.

The paper describes an Icelandic pronunciation dictionary for use in a text-to- speech system for Icelandic. Procedures were implemented to create a consistent training set for grapheme-to-phoneme (g2p) conversion modeling, needed for automatic extensions of the dictionary. The experiments show a clear benefit of using clean data for training, both in terms of PER and in terms of categories of errors made by the g2p algorithm. The results of the dictionary processing were also used to create an initial version of an open source database for Icelandic speech applications. The scripts used in the experiments are available via our Github repository: https://github.com/cadia-lvl/SLT2018.

Jón and Anna Björk’s poster presentation will be at SLT on Friday, Dec. 21 between 10:00 and 12:00 PM. Here’s a sneak peek.
slt_poster_anna_nikulasd_HR

We hope to see you there. If you see Anna or Jón please stop by and say hello.