SpeakerPy
- ΡΡΠΎ Python-Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ° Π΄Π»Ρ ΡΠΈΠ½ΡΠ΅Π·Π° ΡΠ΅ΡΠΈ, ΠΎΡΠ½ΠΎΠ²Π°Π½Π½Π°Ρ Π½Π° ΠΌΠΎΠ΄Π΅Π»ΡΡ
Silero Text-to-Speech.
SpeakerPy
ΠΏΡΠ΅Π΄Π»Π°Π³Π°Π΅Ρ ΡΡΠ΄ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΠ΅ΠΉ Π΄Π»Ρ ΡΠΈΠ½ΡΠ΅Π·Π° ΡΠ΅ΡΠΈ, ΡΡΠΎ Π΄Π΅Π»Π°Π΅Ρ Π΅Π³ΠΎ ΠΏΠΎΠ»Π΅Π·Π½ΡΠΌ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΠΎΠΌ Π΄Π»Ρ ΡΠ°Π·Π»ΠΈΡΠ½ΡΡ
Π·Π°Π΄Π°Ρ ΠΈ ΡΡΠ΅Ρ Π΄Π΅ΡΡΠ΅Π»ΡΠ½ΠΎΡΡΠΈ. ΠΠΈΠΆΠ΅ ΠΏΡΠΈΠ²Π΅Π΄Π΅Π½Ρ Π½Π΅ΠΊΠΎΡΠΎΡΡΠ΅ ΠΏΡΠΈΠΌΠ΅ΡΡ ΠΎΠ±Π»Π°ΡΡΠ΅ΠΉ, Π³Π΄Π΅ ΠΌΠΎΠΆΠ΅Ρ Π±ΡΡΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΎ ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅ SpeakerPy
:
-
ΠΠ±ΡΠ°Π·ΠΎΠ²Π°Π½ΠΈΠ΅: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡΡΡ Π΄Π»Ρ ΠΎΠ·Π²ΡΡΠΈΠ²Π°Π½ΠΈΡ ΡΡΠ΅Π±Π½ΡΡ ΠΌΠ°ΡΠ΅ΡΠΈΠ°Π»ΠΎΠ², ΡΠ°ΠΊΠΈΡ ΠΊΠ°ΠΊ Π»Π΅ΠΊΡΠΈΠΈ, ΡΡΠ°ΡΡΠΈ ΠΈ ΠΊΠ½ΠΈΠ³ΠΈ, ΡΡΠΎ ΠΏΠΎΠΌΠΎΠΆΠ΅Ρ ΡΡΡΠ΄Π΅Π½ΡΠ°ΠΌ ΠΈ ΠΏΡΠ΅ΠΏΠΎΠ΄Π°Π²Π°ΡΠ΅Π»ΡΠΌ Π»Π΅Π³ΡΠ΅ Π²ΠΎΡΠΏΡΠΈΠ½ΠΈΠΌΠ°ΡΡ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΡ ΠΈ ΡΠΊΠΎΠ½ΠΎΠΌΠΈΡΡ Π²ΡΠ΅ΠΌΡ.
-
ΠΡΠ΄ΠΈΠΎΠΊΠ½ΠΈΠ³ΠΈ: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ Π±ΡΡΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ Π΄Π»Ρ ΡΠΎΠ·Π΄Π°Π½ΠΈΡ Π°ΡΠ΄ΠΈΠΎΠΊΠ½ΠΈΠ³ ΠΈΠ· ΡΠ΅ΠΊΡΡΠΎΠ²ΡΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ², ΡΡΠΎ ΠΎΠ±Π»Π΅Π³ΡΠΈΡ Π΄ΠΎΡΡΡΠΏ ΠΊ Π»ΠΈΡΠ΅ΡΠ°ΡΡΡΠ΅ Π΄Π»Ρ Π»ΡΠ΄Π΅ΠΉ Ρ ΠΎΠ³ΡΠ°Π½ΠΈΡΠ΅Π½Π½ΡΠΌΠΈ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΡΠΌΠΈ ΠΈ ΡΠ΅Ρ , ΠΊΡΠΎ ΠΏΡΠ΅Π΄ΠΏΠΎΡΠΈΡΠ°Π΅Ρ ΡΠ»ΡΡΠ°ΡΡ, Π° Π½Π΅ ΡΠΈΡΠ°ΡΡ.
-
ΠΠΎΠ΄ΠΊΠ°ΡΡΡ ΠΈ ΡΠ°Π΄ΠΈΠΎ: SpeakerPy ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ Π΄Π»Ρ ΡΠΎΠ·Π΄Π°Π½ΠΈΡ ΠΏΠΎΠ΄ΠΊΠ°ΡΡΠΎΠ² ΠΈ ΡΠ°Π΄ΠΈΠΎΠΏΠ΅ΡΠ΅Π΄Π°Ρ Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ ΡΠ΅ΠΊΡΡΠΎΠ²ΡΡ ΠΌΠ°ΡΠ΅ΡΠΈΠ°Π»ΠΎΠ², ΡΠ°ΠΊΠΈΡ ΠΊΠ°ΠΊ Π½ΠΎΠ²ΠΎΡΡΠΈ, ΡΡΠ°ΡΡΠΈ ΠΈΠ»ΠΈ Π±Π»ΠΎΠ³ΠΈ.
-
ΠΠΎΡΡΡΠΏΠ½ΠΎΡΡΡ: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ Π±ΡΡΡ ΠΏΠΎΠ»Π΅Π·Π½ΡΠΌ Π΄Π»Ρ ΡΠ°Π·ΡΠ°Π±ΠΎΡΠΊΠΈ ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉ ΠΈ Π²Π΅Π±-ΡΠ°ΠΉΡΠΎΠ² Ρ ΡΡΠ½ΠΊΡΠΈΠ΅ΠΉ Text-to-Speech, ΡΡΠΎ ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΡ ΡΠ΄Π΅Π»Π°ΡΡ ΠΊΠΎΠ½ΡΠ΅Π½Ρ Π΄ΠΎΡΡΡΠΏΠ½ΡΠΌ Π΄Π»Ρ Π»ΡΠ΄Π΅ΠΉ Ρ Π½Π°ΡΡΡΠ΅Π½ΠΈΡΠΌΠΈ Π·ΡΠ΅Π½ΠΈΡ ΠΈΠ»ΠΈ Π΄ΡΡΠ³ΠΈΠΌΠΈ ΠΎΠ³ΡΠ°Π½ΠΈΡΠ΅Π½Π½ΡΠΌΠΈ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΡΠΌΠΈ.
-
ΠΠ·Π²ΡΡΠΈΠ²Π°Π½ΠΈΠ΅ Π²ΠΈΠ΄Π΅ΠΎ: SpeakerPy ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ Π΄Π»Ρ Π°Π²ΡΠΎΠΌΠ°ΡΠΈΡΠ΅ΡΠΊΠΎΠ³ΠΎ ΠΎΠ·Π²ΡΡΠΈΠ²Π°Π½ΠΈΡ Π²ΠΈΠ΄Π΅ΠΎΠΌΠ°ΡΠ΅ΡΠΈΠ°Π»ΠΎΠ², ΡΠ°ΠΊΠΈΡ ΠΊΠ°ΠΊ ΠΏΡΠ΅Π·Π΅Π½ΡΠ°ΡΠΈΠΈ, ΠΎΠ±ΡΡΠ°ΡΡΠΈΠ΅ Π²ΠΈΠ΄Π΅ΠΎ ΠΈΠ»ΠΈ Π΄Π°ΠΆΠ΅ ΠΊΠΎΡΠΏΠΎΡΠ°ΡΠΈΠ²Π½ΡΠ΅ ΡΠΎΠ»ΠΈΠΊΠΈ.
-
ΠΠ½ΠΎΡΡΡΠ°Π½Π½ΡΠ΅ ΡΠ·ΡΠΊΠΈ: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ Π±ΡΡΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ Π΄Π»Ρ ΠΎΠ·Π²ΡΡΠΈΠ²Π°Π½ΠΈΡ ΡΠ΅ΠΊΡΡΠΎΠ² Π½Π° ΠΈΠ½ΠΎΡΡΡΠ°Π½Π½ΡΡ ΡΠ·ΡΠΊΠ°Ρ , ΡΡΠΎ ΠΏΠΎΠΌΠΎΠΆΠ΅Ρ ΠΈΠ·ΡΡΠ°ΡΡΠΈΠΌ ΡΠ·ΡΠΊ Π»ΡΡΡΠ΅ ΠΏΠΎΠ½ΡΡΡ ΠΏΡΠΎΠΈΠ·Π½ΠΎΡΠ΅Π½ΠΈΠ΅ ΠΈ ΠΈΠ½ΡΠΎΠ½Π°ΡΠΈΡ.
-
ΠΠ°Π²ΠΈΠ³Π°ΡΠΈΠΎΠ½Π½ΡΠ΅ ΡΠΈΡΡΠ΅ΠΌΡ: SpeakerPy ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡΠΈΠΌΠ΅Π½ΡΡΡ Π² Π½Π°Π²ΠΈΠ³Π°ΡΠΈΠΎΠ½Π½ΡΡ ΡΠΈΡΡΠ΅ΠΌΠ°Ρ ΠΈ Π³ΠΎΠ»ΠΎΡΠΎΠ²ΡΡ ΠΏΠΎΠΌΠΎΡΠ½ΠΈΠΊΠ°Ρ Π΄Π»Ρ Π°Π²ΡΠΎΠΌΠ°ΡΠΈΡΠ΅ΡΠΊΠΎΠ³ΠΎ ΠΎΠ·Π²ΡΡΠΈΠ²Π°Π½ΠΈΡ ΠΌΠ°ΡΡΡΡΡΠΎΠ², ΠΈΠ½ΡΡΡΡΠΊΡΠΈΠΉ ΠΈ Π΄ΡΡΠ³ΠΎΠΉ ΠΏΠΎΠ»Π΅Π·Π½ΠΎΠΉ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ.
-
Π’Π΅Ρ Π½ΠΈΡΠ΅ΡΠΊΠ°Ρ ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΊΠ°: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ Π±ΡΡΡ ΠΈΠ½ΡΠ΅Π³ΡΠΈΡΠΎΠ²Π°Π½ Π² ΡΠΈΡΡΠ΅ΠΌΡ ΡΠ΅Ρ Π½ΠΈΡΠ΅ΡΠΊΠΎΠΉ ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΊΠΈ Π΄Π»Ρ Π°Π²ΡΠΎΠΌΠ°ΡΠΈΡΠ΅ΡΠΊΠΎΠ³ΠΎ ΠΎΠ·Π²ΡΡΠΈΠ²Π°Π½ΠΈΡ ΠΎΡΠ²Π΅ΡΠΎΠ² Π½Π° ΡΠ°ΡΡΠΎ Π·Π°Π΄Π°Π²Π°Π΅ΠΌΡΠ΅ Π²ΠΎΠΏΡΠΎΡΡ ΠΈΠ»ΠΈ ΠΈΠ½ΡΡΡΡΠΊΡΠΈΠΉ ΠΏΠΎ ΡΠ΅ΡΠ΅Π½ΠΈΡ ΠΏΡΠΎΠ±Π»Π΅ΠΌ.
-
ΠΠ°ΡΠΊΠ΅ΡΠΈΠ½Π³ ΠΈ ΡΠ΅ΠΊΠ»Π°ΠΌΠ°: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ Π±ΡΡΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ Π΄Π»Ρ ΡΠΎΠ·Π΄Π°Π½ΠΈΡ Π³ΠΎΠ»ΠΎΡΠΎΠ²ΡΡ ΠΎΠ±ΡΡΠ²Π»Π΅Π½ΠΈΠΉ, ΠΏΡΠΎΠΌΠΎ-ΡΠΎΠ»ΠΈΠΊΠΎΠ² ΠΈ ΠΏΡΠ΅Π·Π΅Π½ΡΠ°ΡΠΈΠΉ, ΡΡΠΎ ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΡ ΡΡΠΊΠΎΠ½ΠΎΠΌΠΈΡΡ Π²ΡΠ΅ΠΌΡ ΠΈ ΡΡΠ΅Π΄ΡΡΠ²Π° Π½Π° ΠΎΠ·Π²ΡΡΠΈΠ²Π°Π½ΠΈΠ΅ ΠΏΡΠΎΡΠ΅ΡΡΠΈΠΎΠ½Π°Π»ΡΠ½ΡΠΌΠΈ Π΄ΠΈΠΊΡΠΎΡΠ°ΠΌΠΈ.
-
ΠΠ΅Π΄ΠΈΡΠΈΠ½Π°: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ ΠΏΡΠΈΠΌΠ΅Π½ΡΡΡΡΡ Π΄Π»Ρ ΠΎΠ·Π²ΡΡΠΈΠ²Π°Π½ΠΈΡ ΠΌΠ΅Π΄ΠΈΡΠΈΠ½ΡΠΊΠΈΡ ΡΠ΅ΠΊΡΡΠΎΠ², ΠΈΠ½ΡΡΡΡΠΊΡΠΈΠΉ ΠΏΠΎ ΠΏΡΠΈΠΌΠ΅Π½Π΅Π½ΠΈΡ Π»Π΅ΠΊΠ°ΡΡΡΠ² ΠΈΠ»ΠΈ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΠΎΠ² Π΄ΠΈΠ°Π³Π½ΠΎΡΡΠΈΠΊΠΈ, ΡΡΠΎ ΡΠΏΡΠΎΡΡΠΈΡ Π²ΠΎΡΠΏΡΠΈΡΡΠΈΠ΅ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ Π΄Π»Ρ ΠΏΠ°ΡΠΈΠ΅Π½ΡΠΎΠ² ΠΈ ΠΌΠ΅Π΄ΠΈΡΠΈΠ½ΡΠΊΠΈΡ ΡΠΏΠ΅ΡΠΈΠ°Π»ΠΈΡΡΠΎΠ².
-
ΠΠ°ΡΠΊΠ° ΠΈ ΠΈΡΡΠ»Π΅Π΄ΠΎΠ²Π°Π½ΠΈΡ: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡΡΡ Π΄Π»Ρ ΠΎΠ·Π²ΡΡΠΈΠ²Π°Π½ΠΈΡ Π½Π°ΡΡΠ½ΡΡ ΡΡΠ°ΡΠ΅ΠΉ, Π΄ΠΎΠΊΠ»Π°Π΄ΠΎΠ² ΠΈ ΠΊΠΎΠ½ΡΠ΅ΡΠ΅Π½ΡΠΈΠΉ, ΡΡΠΎ ΠΎΠ±Π»Π΅Π³ΡΠΈΡ Π΄ΠΎΡΡΡΠΏ ΠΊ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ Π΄Π»Ρ ΡΡΠ΅Π½ΡΡ ΠΈ ΠΈΡΡΠ»Π΅Π΄ΠΎΠ²Π°ΡΠ΅Π»Π΅ΠΉ.
-
ΠΠ°ΡΡΠΎΠΌΠΈΠ·Π°ΡΠΈΡ Π³ΠΎΠ»ΠΎΡΠΎΠ²ΡΡ Π°ΡΡΠΈΡΡΠ΅Π½ΡΠΎΠ²: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ Π±ΡΡΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ Π΄Π»Ρ ΠΊΠ°ΡΡΠΎΠΌΠΈΠ·Π°ΡΠΈΠΈ Π³ΠΎΠ»ΠΎΡΠ° Π²ΠΈΡΡΡΠ°Π»ΡΠ½ΡΡ Π°ΡΡΠΈΡΡΠ΅Π½ΡΠΎΠ², ΡΠ°ΠΊΠΈΡ ΠΊΠ°ΠΊ Siri, Google Assistant ΠΈΠ»ΠΈ Alexa, ΡΡΠΎ ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΡ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»ΡΠΌ Π²ΡΠ±ΠΈΡΠ°ΡΡ Π³ΠΎΠ»ΠΎΡΠΎΠ²ΡΠ΅ ΠΎΠΏΡΠΈΠΈ, ΠΊΠΎΡΠΎΡΡΠ΅ ΠΈΠΌ Π±ΠΎΠ»ΡΡΠ΅ Π½ΡΠ°Π²ΡΡΡΡ.
-
ΠΠ°ΠΌΠ΅Π½Π° Π³ΠΎΠ»ΠΎΡΠ°: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡΡΡ Π΄Π»Ρ ΡΠΌΠ΅Π½Ρ Π³ΠΎΠ»ΠΎΡΠ° Π² ΡΡΡΠ΅ΡΡΠ²ΡΡΡΠΈΡ Π°ΡΠ΄ΠΈΠΎΠ·Π°ΠΏΠΈΡΡΡ , Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ Π΄Π»Ρ Π°Π½ΠΎΠ½ΠΈΠΌΠΈΠ·Π°ΡΠΈΠΈ ΠΏΠΎΠ΄ΠΊΠ°ΡΡΠΎΠ² ΠΈΠ»ΠΈ ΠΈΠ½ΡΠ΅ΡΠ²ΡΡ.
-
Π’Π΅ΠΊΡΡΠΎΠ²ΡΠ΅ ΡΠ΅Π΄Π°ΠΊΡΠΎΡΡ: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ Π±ΡΡΡ ΠΈΠ½ΡΠ΅Π³ΡΠΈΡΠΎΠ²Π°Π½ Π² ΡΠ΅ΠΊΡΡΠΎΠ²ΡΠ΅ ΡΠ΅Π΄Π°ΠΊΡΠΎΡΡ Π΄Π»Ρ ΠΏΡΠ΅Π΄ΠΎΡΡΠ°Π²Π»Π΅Π½ΠΈΡ ΡΡΠ½ΠΊΡΠΈΠΈ Text-to-Speech, ΡΡΠΎ ΠΏΠΎΠΌΠΎΠΆΠ΅Ρ Π°Π²ΡΠΎΡΠ°ΠΌ ΠΈ ΡΠ΅Π΄Π°ΠΊΡΠΎΡΠ°ΠΌ ΠΏΡΠΎΠ²Π΅ΡΡΡΡ ΡΠ²ΠΎΠΈ ΡΠ΅ΠΊΡΡΡ Π½Π° ΠΎΡΠΈΠ±ΠΊΠΈ ΠΈ ΡΡΠΈΠ»ΠΈΡΡΠΈΡΠ΅ΡΠΊΠΈΠ΅ Π½Π΅ΡΠΎΡΠ½ΠΎΡΡΠΈ.
ΠΡΠΈ ΠΏΡΠΈΠΌΠ΅ΡΡ Π»ΠΈΡΡ ΡΠ°ΡΡΡ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΠ΅ΠΉ ΠΏΡΠΈΠΌΠ΅Π½Π΅Π½ΠΈΡ SpeakerPy. ΠΠ»Π°Π³ΠΎΠ΄Π°ΡΡ ΡΠ²ΠΎΠ΅ΠΉ Π³ΠΈΠ±ΠΊΠΎΡΡΠΈ ΠΈ ΠΌΠΎΡΠ½ΡΠΌ ΡΡΠ½ΠΊΡΠΈΡΠΌ, SpeakerPy ΠΌΠΎΠΆΠ΅Ρ Π±ΡΡΡ Π°Π΄Π°ΠΏΡΠΈΡΠΎΠ²Π°Π½ Π΄Π»Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ Π² ΡΠ°ΠΌΡΡ ΡΠ°Π·Π½ΠΎΠΎΠ±ΡΠ°Π·Π½ΡΡ ΡΡΠ΅ΡΠ°Ρ ΠΈ ΠΎΡΡΠ°ΡΠ»ΡΡ , Π³Π΄Π΅ ΡΡΠ΅Π±ΡΠ΅ΡΡΡ ΡΠΈΠ½ΡΠ΅Π·ΠΈΡΠΎΠ²Π°ΡΡ ΡΠ΅ΡΡ ΠΈΠ· ΡΠ΅ΠΊΡΡΠ°. ΠΡ ΠΌΠ°ΡΠΊΠ΅ΡΠΈΠ½Π³Π° ΠΈ ΡΠ΅ΠΊΠ»Π°ΠΌΡ Π΄ΠΎ ΠΌΠ΅Π΄ΠΈΡΠΈΠ½Ρ ΠΈ Π½Π°ΡΠΊΠΈ, SpeakerPy ΠΌΠΎΠΆΠ΅Ρ ΡΡΠ°ΡΡ ΠΏΠΎΠ»Π΅Π·Π½ΡΠΌ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΠΎΠΌ Π΄Π»Ρ ΡΠ°Π·ΡΠ°Π±ΠΎΡΡΠΈΠΊΠΎΠ², ΡΠΏΠ΅ΡΠΈΠ°Π»ΠΈΡΡΠΎΠ² ΠΏΠΎ ΠΊΠΎΠ½ΡΠ΅Π½ΡΡ ΠΈ ΠΊΠΎΠ½Π΅ΡΠ½ΡΡ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Π΅ΠΉ.
Π ΡΠ΅Π»ΠΎΠΌ, Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΠΈ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ SpeakerPy ΠΎΠ³ΡΠ°Π½ΠΈΡΠ΅Π½Ρ Π»ΠΈΡΡ ΡΠ°Π½ΡΠ°Π·ΠΈΠ΅ΠΉ ΠΈ ΠΏΠΎΡΡΠ΅Π±Π½ΠΎΡΡΡΠΌΠΈ ΠΊΠΎΠ½ΠΊΡΠ΅ΡΠ½ΡΡ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Π΅ΠΉ ΠΈΠ»ΠΈ ΠΏΡΠΎΠ΅ΠΊΡΠΎΠ². ΠΠ»Π°Π³ΠΎΠ΄Π°ΡΡ ΡΠ²ΠΎΠ΅ΠΉ ΡΠ½ΠΈΠ²Π΅ΡΡΠ°Π»ΡΠ½ΠΎΡΡΠΈ ΠΈ ΠΏΡΠΎΡΡΠΎΡΠ΅ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ, SpeakerPy ΠΌΠΎΠΆΠ΅Ρ Π½Π°ΠΉΡΠΈ ΡΠ²ΠΎΠ΅ ΠΌΠ΅ΡΡΠΎ Π² ΡΠ°ΠΌΡΡ ΡΠ°Π·Π½ΡΡ ΠΎΠ±Π»Π°ΡΡΡΡ ΠΈ ΠΏΠΎΠΌΠΎΡΡ ΡΠ΅ΡΠ°ΡΡ ΡΠ°ΠΌΡΠ΅ ΡΠ°Π·Π½ΠΎΠΎΠ±ΡΠ°Π·Π½ΡΠ΅ Π·Π°Π΄Π°ΡΠΈ.
- Π’ΡΠ°Π½ΡΠΊΡΠΈΠΏΡΠΈΡ ΡΠΈΡΠ΅Π» ΠΈ Π°Π½Π³Π»ΠΈΠΉΡΠΊΠΈΡ ΡΠ»ΠΎΠ²: SpeakerPy ΡΠΏΠΎΡΠΎΠ±Π΅Π½ ΠΎΠ·Π²ΡΡΠΈΠ²Π°ΡΡ ΡΠΈΡΠ»Π° ΠΈ Π°Π½Π³Π»ΠΈΠΉΡΠΊΠΈΠ΅ ΡΠ»ΠΎΠ²Π° ΡΠ΅ΡΠ΅Π· ΡΡΠ°Π½ΡΠΊΡΠΈΠΏΡΠΈΡ.
- Π‘ΠΈΠ½ΡΠ΅Π· Π±ΠΎΠ»ΡΡΠΈΡ ΠΎΠ±ΡΠ΅ΠΌΠΎΠ² ΡΠ΅ΠΊΡΡΠ°: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ ΡΠΈΠ½ΡΠ΅Π·ΠΈΡΠΎΠ²Π°ΡΡ Π±ΠΎΠ»ΡΡΠΈΠ΅ ΠΎΠ±ΡΠ΅ΠΌΡ ΡΠ΅ΠΊΡΡΠ° Π±Π΅Π· ΠΏΡΠΎΠ±Π»Π΅ΠΌ.
- ΠΠΎΡΡΠ΅ΠΊΡΠ½ΠΎΠ΅ Π΄Π΅Π»Π΅Π½ΠΈΠ΅ ΡΠ΅ΠΊΡΡΠ° Π½Π° ΠΊΡΡΠΊΠΈ: Π±Π»Π°Π³ΠΎΠ΄Π°ΡΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠΈ nltk, SpeakerPy ΠΊΠΎΡΡΠ΅ΠΊΡΠ½ΠΎ Π΄Π΅Π»ΠΈΡ Π±ΠΎΠ»ΡΡΠΈΠ΅ ΡΠ΅ΠΊΡΡΡ Π½Π° ΠΏΡΠ΅Π΄Π»ΠΎΠΆΠ΅Π½ΠΈΡ.
- ΠΠ΅ΡΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅ ΡΠΈΠ½ΡΠ΅Π·ΠΈΡΠΎΠ²Π°Π½Π½ΠΎΠ³ΠΎ ΡΠ΅ΠΊΡΡΠ°: SpeakerPy ΡΠΈΠ½ΡΠ΅Π·ΠΈΡΡΠ΅Ρ ΠΈ Ρ ΡΠ°Π½ΠΈΡ ΡΠ΅ΠΊΡΡ ΠΏΠΎ ΠΊΡΡΠΊΠ°ΠΌ, ΡΡΠΎ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ ΠΊΠ΅ΡΠΈΡΠΎΠ²Π°ΡΡ ΡΠΆΠ΅ ΡΠ°Π½Π΅Π΅ ΡΠΈΠ½ΡΠ΅Π·ΠΈΡΠΎΠ²Π°Π½Π½ΡΠΉ ΡΠ΅ΠΊΡΡ ΠΈ ΠΈΠ·Π±Π΅ΠΆΠ°ΡΡ ΠΏΠΎΠ²ΡΠΎΡΠ½ΠΎΠ³ΠΎ ΡΠΈΠ½ΡΠ΅Π·ΠΈΡΠΎΠ²Π°Π½ΠΈΡ.
- Π Π°Π±ΠΎΡΠ° Π² Π°Π²ΡΠΎΠ½ΠΎΠΌΠ½ΠΎΠΌ ΡΠ΅ΠΆΠΈΠΌΠ΅: SpeakerPy ΡΠΈΠ½ΡΠ΅Π·ΠΈΡΡΠ΅Ρ Π·Π²ΡΠΊ Π»ΠΎΠΊΠ°Π»ΡΠ½ΠΎ, Π±Π΅Π· ΠΏΠΎΠ΄ΠΊΠ»ΡΡΠ΅Π½ΠΈΡ ΠΊ ΠΈΠ½ΡΠ΅ΡΠ½Π΅ΡΡ, ΡΡΠΎ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ Π΅Π³ΠΎ Π² Π°Π²ΡΠΎΠ½ΠΎΠΌΠ½ΠΎΠΌ ΡΠ΅ΠΆΠΈΠΌΠ΅.
- Π‘ΠΎΡ ΡΠ°Π½Π΅Π½ΠΈΠ΅ ΡΠΈΠ½ΡΠ΅Π·ΠΈΡΠΎΠ²Π°Π½Π½ΠΎΠ³ΠΎ ΡΠ΅ΠΊΡΡΠ° Π² MP3: SpeakerPy ΠΏΡΠ΅Π΄ΠΎΡΡΠ°Π²Π»ΡΠ΅Ρ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΡ ΡΠΎΡ ΡΠ°Π½ΡΡΡ ΡΠΈΠ½ΡΠ΅Π·ΠΈΡΠΎΠ²Π°Π½Π½ΡΠΉ ΡΠ΅ΠΊΡΡ Π² ΡΠΎΡΠΌΠ°ΡΠ΅ MP3.
- 2 ΠΠ ΠΠΠ£
SpeakerPy
ΠΌΠΎΠΆΠ½ΠΎ ΡΡΡΠ°Π½ΠΎΠ²ΠΈΡΡ Ρ ΠΏΠΎΠΌΠΎΡΡΡ pip:
pip install speakerpy
Π‘ΠΊΠ°ΡΠ°ΡΡ ΠΎΠ±ΡΠ°Π·
docker pull xable/speakerpy
Π‘ΠΎΠ±ΡΠ°ΡΡ ΠΎΠ±ΡΠ°Π·(Π²Π΅ΡΠΈΡ 8.27GB):
make docker-build
ΠΠ°ΠΏΡΡΡΠΈΡΡ ΠΎΠ±ΡΠ°Π·:
make docker-run
β°ββ€ python -m speakerpy --help
usage: __main__.py [-h] -l {ru,en} -f FILE -t {mp3,speak} [-sr SAMPLE_RATE] [-s SPEED] [-n NAME_TEXT] [-a AUDIO_DIR]
ποΈ SpeakerPy: CLI Π΄Π»Ρ ΡΠΈΠ½ΡΠ΅Π·Π° ΡΠ΅ΡΠΈ Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ SpeakerPy ποΈ
options:
-h, --help show this help message and exit
-l {ru,en}, --language {ru,en}
Π―Π·ΡΠΊ ΡΠΈΠ½ΡΠ΅Π·Π° (ru | en)
-f FILE, --file FILE ΠΡΡΡ ΠΊ ΡΠ°ΠΉΠ»Ρ Ρ ΡΠ΅ΠΊΡΡΠΎΠΌ Π΄Π»Ρ ΠΎΠ·Π²ΡΡΠΈΠ²Π°Π½ΠΈΡ
-t {mp3,speak}, --type_out {mp3,speak}
ΠΠ°ΠΊΠΈΠΌ ΠΎΠ±ΡΠ°Π·ΠΎΠΌ Π²ΡΠ²Π΅ΡΡΠΈ ΡΠΈΠ½ΡΠ΅Π·ΠΈΡΠΎΠ²Π°Π½Π½ΡΠΉ ΡΠ΅ΠΊΡΡ (mp3 | speak)
-sr SAMPLE_RATE, --sample_rate SAMPLE_RATE
Π§Π°ΡΡΠΎΡΠ° Π΄ΠΈΡΠΊΡΠ΅ΡΠΈΠ·Π°ΡΠΈΠΈ (ΠΏΠΎ ΡΠΌΠΎΠ»ΡΠ°Π½ΠΈΡ: 48000)
-s SPEED, --speed SPEED
Π‘ΠΊΠΎΡΠΎΡΡΡ ΡΡΠ΅Π½ΠΈΡ (ΠΏΠΎ ΡΠΌΠΎΠ»ΡΠ°Π½ΠΈΡ: 1.0)
-n NAME_TEXT, --name_text NAME_TEXT
ΠΠΌΡ Π΄Π»Ρ ΡΠ΅ΠΊΡΡΠ°, Ρ ΡΠ°ΠΊΠΈΠΌ ΠΈΠΌΠ΅Π½Π΅ΠΌ ΡΠΎΡ
ΡΠ°Π½ΠΈΡΡΡ ΠΈΡΠΎΠ³ΠΎΠ²ΡΠΉ mp3 ΡΠ°ΠΉΠ» (ΠΏΠΎ ΡΠΌΠΎΠ»ΡΠ°Π½ΠΈΡ: ΠΈΠΌΡ ΡΠ°ΠΉΠ»Π° Ρ ΡΠ΅ΠΊΡΡΠΎΠΌ)
-a AUDIO_DIR, --audio_dir AUDIO_DIR
ΠΠ°ΠΏΠΊΠ° Π΄Π»Ρ ΡΠΎΡ
ΡΠ°Π½Π΅Π½ΠΈΡ Π³ΠΎΡΠΎΠ²ΡΡ
Π°ΡΠ΄ΠΈΠΎ ΡΠ°ΠΉΠ»ΠΎΠ² (ΠΏΠΎ ΡΠΌΠΎΠ»ΡΠ°Π½ΠΈΡ: ΡΠ΅ΠΊΡΡΠ°Ρ ΠΏΠ°ΠΏΠΊΠ°)
ΠΡΠΈΠΌΠ΅ΡΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ:
python -m speakerpy -l ru -t speak -f ./books/example.txt -s 1.2;
python -m speakerpy -l ru -t mp3 -f ./books/example.txt;
python -m speakerpy -l en -t speak -f ./books/example.txt;
python -m speakerpy -l en -t mp3 -f ./books/example.txt;
ΠΡΠΎΠ΅ΠΊΡ ΡΠΎΡΡΠΎΠΈΡ ΠΈΠ· Π΄Π²ΡΡ ΠΎΡΠ½ΠΎΠ²Π½ΡΡ ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½ΡΠΎΠ²: Lib Speak ΠΈ Lib SL Text.
Lib Speak Π²ΠΊΠ»ΡΡΠ°Π΅Ρ ΠΊΠ»Π°ΡΡΡ Speaker
ΠΈ SpeakerBase
Π΄Π»Ρ ΡΠΈΠ½ΡΠ΅Π·Π° ΡΠ΅ΡΠΈ Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Silero. ΠΡΠ½ΠΎΠ²Π½ΡΠ΅ ΠΌΠ΅ΡΠΎΠ΄Ρ ΠΊΠ»Π°ΡΡΠ° Speaker
:
speak
: ΠΏΡΠΎΠΈΠ·Π½Π΅ΡΠ΅Π½ΠΈΠ΅ ΡΠ΅ΠΊΡΡΠ°.to_mp3
: ΠΊΠΎΠ½Π²Π΅ΡΡΠ°ΡΠΈΡ ΡΠ΅ΠΊΡΡΠ° Π² Π°ΡΠ΄ΠΈΠΎΡΠ°ΠΉΠ» MP3.
from lib_speak import Speaker
from lib_sl_text import SeleroText
text = SeleroText("ΠΡΠΈΠΌΠ΅Ρ ΡΠ΅ΠΊΡΡΠ° Π΄Π»Ρ ΡΠΈΠ½ΡΠ΅Π·Π° ΡΠ΅ΡΠΈ")
speaker = Speaker(model_id="ru_v3", language="ru", speaker="aidar", device="cpu")
speaker.speak(text=text, sample_rate=48000, speed=1.0)
from lib_speak import Speaker
from lib_sl_text import SeleroText
text = SeleroText("ΠΡΠΈΠΌΠ΅Ρ ΡΠ΅ΠΊΡΡΠ° Π΄Π»Ρ ΡΠΈΠ½ΡΠ΅Π·Π° ΡΠ΅ΡΠΈ")
speaker = Speaker(model_id="ru_v3", language="ru", speaker="aidar", device="cpu")
speaker.to_mp3(text=text, name_text="Π’Π΅ΠΊΡΡ", sample_rate=48000, audio_dir=pathlib.Path(__file__).parent.parent / "mp3", speed=1.0)
Lib SL Text ΡΠΎΠ΄Π΅ΡΠΆΠΈΡ ΠΊΠ»Π°ΡΡ SeleroText
Π΄Π»Ρ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ ΡΠ΅ΠΊΡΡΠ° ΠΏΠ΅ΡΠ΅Π΄ ΡΠΈΠ½ΡΠ΅Π·ΠΎΠΌ ΡΠ΅ΡΠΈ. ΠΡΠ½ΠΎΠ²Π½ΠΎΠΉ ΠΌΠ΅ΡΠΎΠ΄ ΠΊΠ»Π°ΡΡΠ° SeleroText
:
chunk
: ΡΠ°Π·Π΄Π΅Π»Π΅Π½ΠΈΠ΅ ΡΠ΅ΠΊΡΡΠ° Π½Π° Π±Π»ΠΎΠΊΠΈ.
text = SeleroText("ΠΡΠΈΠ²Π΅Ρ, ΠΌΠΈΡ!", to_language="ru")
Π Π°Π·Π΄Π΅Π»Π΅Π½ΠΈΠ΅ ΡΠ΅ΠΊΡΡΠ° Π½Π° ΠΊΡΡΠΊΠΈ Ρ ΠΏΠΎΠΌΠΎΡΡΡ ΠΌΠ΅ΡΠΎΠ΄Π° chunk()
:
for chunk in text.chunk():
print(chunk)