Vraag Natuurlijk klinkende tekst naar spraak?


Ik ben op zoek naar een aantal eenvoudig te installeren tekst-naar-spraak software voor Ubuntu die natuurlijk klinkt. Ik heb geïnstalleerd Festival, Gespeaker, enz., maar niets klinkt heel natuurlijk. Allemaal heel synthetisch en moeilijk te begrijpen.

Enige aanbevelingen die er zijn?


77
2017-07-20 17:36


oorsprong


Mogelijk duplicaat van Hoe kan ik tekst-naar-spraak-software installeren en gebruiken? - Organic Addict


antwoorden:


SVOX pico2wave

In aanvulling op de andere antwoorden:

Een zeer minimalistische TTS, een beter klinkend dan espeak of mbrola (naar mijn mening).

Wat informatie:
https://launchpad.net/ubuntu/precise/+source/svox/

Ik begrijp niet waarom pico2wave, vergeleken met espeak of mbrola, zelden wordt besproken. Het is klein, maar klinkt echt goed (natuurlijk). Zonder aanpassing hoor je een natuurlijk klinkende vrouwenstem.

EN ... in vergelijking met Mbrola herkent het eenheden en spreekt het op de juiste manier!
Bijvoorbeeld:

  • 2 ° C → twee graden
  • 2 m → twee meter
  • 2kg → twee kilogram

Na installatie gebruik ik het in een script:

#!/bin/bash
pico2wave -l=de-DE -w=/tmp/test.wav "$1"
aplay /tmp/test.wav
rm /tmp/test.wav

Voer het vervolgens uit met de gewenste tekst:

<scriptname>.sh "hello world"

of lees de inhoud van een volledig bestand:

<scriptname>.sh "$(cat <filename>)"

Dat is alles voor een lichtgewicht, stabiel werkende TTS op Ubuntu.


48
2017-08-24 15:12



Voor zover ik kan zien, gebruikt het alleen cli-parameters als invoer. Is er een manier om pico2wave tekst uit een bestandsnaam te laten lezen? - Carlos Eugenio Thompson Pinzón
pico2wave zit in het pakket libttspico-utils in recente versies van ubuntu. @ CarlosEugenioThompsonPinzón cat <filename> | xargs -I foo -0 pico2wave -w blah.wav foo - naught101
@ CarlosEugenioThompsonPinzón pico2wave -w a.wav "$(input.txt)" =). Erkomen dat deze CLI-interface slecht ontwerp is: in tegenstelling tot de overgrote meerderheid van CLI's, en mogelijk om de. Te bereiken OS max CLI arg lengte. - Ciro Santilli 新疆改造中心 六四事件 法轮功
@Koen Ik weet het niet! :-) Probeer zoals elk ander probleem een ​​minimaal voorbeeld te geven, bijvoorbeeld gebruik makend van echo {1..1000} - Ciro Santilli 新疆改造中心 六四事件 法轮功
@ user49557 We mogen de vragen van anderen niet kapen, dus misschien kun je een nieuwe vraag maken, uitleggen wat je precies hebt geïnstalleerd en wat er mis is gegaan, en dan kan ik je altijd proberen en helpen (geen garanties echter , Ik ben geen expert: P) - Koen


Ik geloof dat ik de beste TTS-software gratis heb gevonden met een Google Chrome-extensie genaamd "SpeakIt". Dit werkt alleen in de Chrome-browser voor mij op Ubuntu. Het werkt om de een of andere reden niet met Chromium. SpeakIt wordt geleverd met twee vrouwenstemmen die allebei erg realistisch klinken in vergelijking met al het andere dat er is. Er zijn ten minste vier meer mannelijke en vrouwelijke stemmen die worden vermeld als Chrome-extensies als u in de Chrome Web Store zoekt met "TTS" als uw zoekopdracht.

https://chrome.google.com/webstore/detail/speakit/pgeolalilifpodheeocdmbhehgnkkbak?utm_source=chrome-ntp-icon

Voor gebruik op een website. markeer de tekst die u wilt lezen en klik met de rechtermuisknop en "SpeakIt" of klik op het SpeakIt-pictogram dat is gekoppeld op de Chrome-balk bovenaan.

Firefox-gebruikers hebben ook twee opties. Binnen Firefox-add-ons, zoek je naar TTS en vind je "Click Speak" en ook "Text to Voice". De stemmen zijn niet zo goed als de Chrome SpeakIt-stemmen, maar zijn zeker bruikbaar.

De SpeakIt-extensie maakt gebruik van iSpeech-technologie en voor een prijs van $ 20 per jaar kan de site tekst converteren naar MP3-audiobestanden. U kunt tekst, URL's, RSS-feeds en documenten zoals TXT, DOC en PDF invoeren en deze naar MP3 exporteren. Je kunt podcasts maken, audio insluiten, enz. Hier is een link ...

http://www.ispeech.org/free.text.to.speech.tts.software

en een voorbeeld van hun audio (weet niet hoe lang de link zal duren) ...

http://www.ispeech.org/view/681080/4429622


19
2018-01-27 00:11



Helaas werken geen van de browseropties voor PDF-bestanden. Ben je er een tegengekomen die dat wel doet? Ik zou graag alinea's kunnen selecteren om uit een PDF te kunnen lezen (dus geen bits naar terminal of andere plakken) - kungfujam
deze uitbreiding werkt voor mij op chromium 50.0.2661.94 met Debian 8.4 en het is geweldig! ik hou vooral van de Engelse vrouwenstem. mijn enige klacht is dat het te lang op komma's pauzeert. - mulllhausen
Het spreekt vaak verkeerd uit tegen woorden en kost ook tijd om de tekst naar een aparte server te sturen in plaats van alleen je eigen systeem te gebruiken. - Goddard


Eenvoudige Google TTS

Vanwege het ontbreken van een beter alternatief schreef ik een bash-script die interfaces met een perlscript van Michal Fapso om TTS te leveren via Google Translate. Uit de projectbeschrijving:

Het is de bedoeling om een ​​eenvoudig te gebruiken interface te bieden voor tekst-naar-spraakuitvoer via het spraaksynthesesysteem van Google. Een fallback-optie met pico2wave zorgt automatisch voor TTS-synthese in het geval er geen internetverbinding wordt gevonden.

In zijn huidige staat ondersteunt de wrapper het lezen van standaardinvoer, platte tekstbestanden en de X-selectie (gemarkeerde tekst).

De belangrijkste kenmerken zijn:

  • online TTS-synthese via Google translate
  • offline TTS-synthese via pico2wave
  • ondersteunt een verscheidenheid aan verschillende talen
  • kan lezen uit CLI, tekstbestanden en gemarkeerde tekst
  • ondersteunt het lezen van gemarkeerde tekst met vaste opmaak (bijvoorbeeld PDF-bestanden)

Installatie en gebruik zijn gedocumenteerd op de projectpagina.

Ik zou blij zijn als je het eens probeerde. Foutmeldingen en andere feedback zijn welkom!


11
2017-08-23 19:18



Dit moet een van de coolste projecten zijn die ik ooit heb gezien. Gewoon wow.
Dit wordt niet langer onderhouden. - Goddard


Ik heb hoog en laag gekeken naar tekst naar spraak voor Ubuntu dat van hoge kwaliteit is. Er is geen. Mijn stembanden zijn verlamd, dus ik had TTS nodig om steminstructies toe te voegen aan mijn Ubuntu-video's. U kunt hier commerciële hoogwaardige tekst-naar-spraak software downloaden: http://wizzardsoftware.com/att_desktop_overview.php  Het is gewoon erg duur. Uiteindelijk heb ik Natural Reader voor Windows gekocht (werkt niet in Ubuntu onder Wine) voor $ 40. Misschien krijg ik later de Linux-versie.

Ik hoop dat dat helpt.


8
2017-07-20 17:57



kerel, er is en ik gebruikte het zoals vorige week er zijn minstens 5 of 6 en ik kan niet voor het leven van mij nu een van hen vinden, moet houden van onze gemeenschap - mchid
Textaloud heeft instructies om hun product onder wijn te laten werken. zien nextup.com/forum/viewtopic.php?t=3349   Ik geloof dat cepstral ook een linux-poort heeft. Ik heb mijn favoriete software balabolka niet kunnen gebruiken. Ik heb windows 10 voornamelijk geïnstalleerd voor tts-verwerking. MS David is goed en vergelijkbaar met cepstral david. De vorige is gratis als je Windows 10 hebt. - Bhikkhu Subhuti


Ik heb onderzoek gedaan naar de best klinkende en gemakkelijk in te stellen tekst-naar-spraak-stemmen. Hieronder is een lijst met wat ik dacht dat de top 5-producten waren in volgorde van geluidskwaliteit. De meeste websites die aan dit product zijn gekoppeld, hebben een interactieve demo waarmee u uw eigen vastberadenheid kunt bepalen.

  1. NeoSpeech
  2. IVONA
  3. Acapela
  4. AT & T Natuurlijke stemmen
  5. CereProc-voices

6
2018-04-24 15:35



zijn er beschikbaar voor Linux? ik denk het niet - Mehdi Khademloo


Pico en espeak zijn leuk en gemakkelijk om naar het werk te gaan, maar ze zijn niet zo goed. De standaardfestivalstemmen zijn ook niet zo goed. Festival is echter een op schema's gebaseerd spraakraamwerk, waarbij een aantal onderzoekers veel betere plug-in voices hebben gebouwd. Je kunt de pico2wave-kwaliteit op voorraad Ubuntu gemakkelijk overtreffen, omdat een van die stemmen beschikbaar is als een kant-en-klaar pakket.

Om Festival natuurlijk te laten klinken, moet je het volgende doen:

sudo apt-get install festival
sudo apt-get install festvox-us-slt-hts
festival -i
festival> (voice_cmu_us_slt_arctic_hts) 
festival> (SayText "Don't hate me, I'm just doing my job!")

U kunt dit doen vanaf de opdrachtregel door te gebruiken -b (of --batch) en zet elke opdracht in enkele aanhalingstekens:

festival -b '(voice_cmu_us_slt_arctic_hts)' \
    '(SayText "The temperature is 22 degrees centigrade and there is a slight breeze from the west.")'

U kunt andere heel goed stemmen uit de Nitech repository, maar ze te installeren is pietluttige, en de standaard paden veranderd, zodat de bestandsnaam verwijzingen in de gebundelde schema bestanden moeten handmatig worden bewerkt om te werken aan voorraad Ubuntu.


6
2018-04-25 19:31



Trouwens, in Ubuntu 16.04 lijkt dit pakket te ontbreken. Je kunt de deb van Debian downloaden en installeren en het werkt prima: packages.debian.org/sid/all/festvox-us-slt-hts/download sudo dpkg -i Downloads / festvox-us-slt-hts_0.2010.10.25-2_all.deb - Jon Watte


Combineer SVOX-tools (pico) met LibreOffice:

SVOX (pico) tools zijn eenvoudig te installeren en leveren stemmen van goede kwaliteit in Ubuntu. Installeer het:

sudo apt-get install libttspico0 libttspico-utils libttspico-data

U kunt LibreOffice gebruiken in combinatie met SVOX (pico) -hulpprogramma's door de. Te installeren "Lees tekst" -extensie en je krijgt een "GUI" voor deze uitstekende TTS-software:

Stel de opties voor Read Text Extension in met Tools - Add-ons - Selectie lezen .... Gebruik / Usr / bin / python als het externe programma. Selecteer een opdrachtregeloptie die het token bevat (PICO_READ_TEXT_PY), je wilt misschien een aantal van hen proberen.

Nu hoef je alleen wat tekst te selecteren in LO Writer, Calc, Impress of Draw en klik je op het pictogram dat als een werkbalk is toegevoegd (een blij gezicht met een ballon).


5
2017-12-15 00:48





Ik vind Nitech HTS-stemmen op het festival heel natuurlijk en geruststellend over alle andere stemmen die ik heb gehoord. Zie deze link over het instellen van Nitech en andere geluiden met een festival. Ik heb geen goede gui gevonden die ik kan gebruiken om die stemmen te configureren, maar ze instellen via festival.scm werkt nog steeds. Dat bericht is erg oud en misschien wil je de daadwerkelijke installatiemap vinden met opdracht "locate festival"


4
2017-11-09 13:56



Het lijkt heel goed te zijn. Gevonden demo's hier cstr.ed.ac.uk/projects/festival/onlinedemo.html - Iacchus
Ja, de Nitech-stemmen zijn kop en schouders boven andere Festival-stemmen (behalve de CMU-stemmen, die ook erg goed zijn.) Jammer dat ze moeilijk te installeren zijn. Er is één goede CMU-stem met een standaardpakket in Ubunut, het heet cmu_us_slt_arctic_hts en wordt geleverd in het pakket festvox-us-slt-hts. Het is veel beter dan pico of espeak! - Jon Watte


Dit is wat ik deed pure natuurlijke spraak voor pdf en andere tekstbestanden (andere oplossingen zijn niet natuurlijk of het zijn gewoon betaalde services). Dit is eigenlijk een werk rond het gebruik van chroom of chroom, maar werkt snel en eenvoudig.

  1. Installeren Zeg het! uitbreiding op uw chroom of chroom.
  2. Installeren PDF Viewer als u chroom gebruikt (chrome heeft al een pdf-viewer gratis) en vinkt u 'Allow in incognito' en 'Allow access to file URLs' aan in extensiesinstellingen van chrome.
  3. Versleep je pdf naar de browser.
  4. Markeer nu wat tekst en klik met de rechtermuisknop en selecteer SpeakIt! zodat je naar puur natuurlijke tekst-naar-spraak kunt luisteren.

Er zijn ook manieren om andere bestanden zoals .doc en .txt in Chrome te openen en hetzelfde te doen. Er zijn nog andere extensies voor Chrome die pdf-bestanden bekijken, controleer of deze beter bij u passen. Daarnaast kun je allerlei soorten teksten in Google Drive uploaden en SpeakIt! Gebruiken. om het voor je te lezen. Een andere extensie genaamd 'Spreek tekst' werkt op dezelfde manier en heeft natuurlijke spraak.


4
2017-12-12 01:54



Kun je uitleggen hoe je SpeakIt kunt maken om pdf-bestanden te lezen die zijn opgeslagen in Google Drive? - Marco Lackovic