Скрипты для Linux
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

195 lines
6.9 KiB

#!/bin/bash
# Общественное достояние, 2024, Алексей Безбородов (Alexei Bezborodov) <AlexeiBv+mirocod_txt2mp3@narod.ru>
# Озвучивание текста из файла
# Параметры по умолчанию
emotion='neutral'
speaker='ermil'
speed='1.0'
verbose=
ffmpeg_opt=""
version=1.0
input_file=""
out_file=""
format="mp3"
quality="hi"
lang="ru_RU"
ShowHelp() {
cat << EOF
Использование: txt2mp3 -i <text_file> [-o <mp3_file>] [-hV]
Озвучивание текста
-h, -help, --help Посмотреть помощь.
-v, -version, --version Посмотреть версию программы.
-i, -input, --input Входной текстовый файл.
-o, -output, --output Выходной файл звуковой.
-e, -emotion, --emotion Эмоциональный настрой говорящего. Может принимать значения "neutral", "good", "evil". По умолчанию "$emotion".
-s, -speaker, --speaker Голос говорящего. Может принимать значения "oksana","jane","omazh","zahar","ermil","silaerkan","erkanyavas","alyss", "nick". По умолчанию "$speaker".
-S, -speed, --speed Скорость озвучки. По умолчанию "$speed".
-O, -ffmpeg_opt, --ffmpeg_opt Дополнительные параметры ffmpeg.
-f, -format, --format Выходной формат. Может быть либо "mp3", либо "wav". По умолчанию "$format".
-q, -quality, --quality Качество выходного файла. Может быть либо "hi", либо "lo". По умолчанию "$quality".
-l, -lang, --lang Язык озвучки. По умолчанию "$lang".
-V, -verbose, --verbose Подробный вывод.
EOF
}
# $@ is all command line parameters passed to the script.
# -o is for short options like -v
# -l is for long options with double dash like --version
# the comma separates different long options
# -a is for long options with single dash like -version
# Example
# 'h' is a no-value option.
# 'v:' implies that option -v has value and is a mandatory option. ':' means has a value.
# 't::' implies that option -t has value but is optional. '::' means optional.
options=$(getopt --long "help,version,verbose,input:,output:,emotion:,speaker:,speed:,ffmpeg_opt:,format:,quality:,lang:" -o "hvVi:o:e:s:S:O:f:q:l:" -a -- "$@")
# set --:
# If no arguments follow this option, then the positional parameters are unset. Otherwise, the positional parameters
# are set to the arguments, even if some of them begin with a ‘-’.
eval set -- "$options"
while true
do
case "$1" in
-h|--help)
ShowHelp
exit
;;
-v|--version)
echo $version
exit
;;
-V|--verbose)
verbose=true
;;
-i|--input)
input_file="$2"
;;
-o|--output)
out_file="$2"
;;
-e|--emotion)
emotion="$2"
;;
-s|--speaker)
speaker="$2"
;;
-S|--speed)
speed="$2"
;;
-O|--ffmpeg_opt)
ffmpeg_opt="$2"
;;
-f|--format)
format="$2"
;;
-q|--quality)
quality="$2"
;;
-l|--lang)
lang="$2"
;;
--)
shift
break;;
esac
shift
done
unuse_param="$*"
if [ "${input_file}" = "" ] || [ "$unuse_param" != "" ]; then
[ "$unuse_param" != "" ] && echo "Параметры не расшифрованы \"$unuse_param\""
ShowHelp
exit
fi
[ "$out_file" = "" ] && { out_file="$input_file.mp3"; [ $verbose ] && echo "Выходное имя файла \"$out_file\""; }
source_text=$(cat "${input_file}")
# Удаляем все пробелы в начале и в конце строк и заменяем два и более пробелов на один, удаляем все непечатаемые символы
source_text="$(echo "${source_text//[$'\t\r\n']}" | sed 's/^ *//;s/[ ^]*$//;s/ */ /;s/[^[:blank:][:print:]]//g')"
#[ $verbose ] && echo "Исходный текст $source_text" >> "out.txt"
ping -c 3 ya.ru &>/dev/null || { echo "Интернет недоступен."; exit; }
split_size=1450
[ $verbose ] && echo "Длина текста ${#source_text}: Разбиваем на части по $split_size"
txt_array=()
space_char=" "
for ((i=1;i<=${#source_text};i++)); do
cur_char=${source_text:$i-1:1}
cur_text="${cur_text}${cur_char}"
if [ "$cur_char" = "$space_char" ] && [ ${#cur_text} -ge $split_size ] || [ $i = ${#source_text} ]; then
# Максимальная длина SEND_IRI - 1590 символов, длина SEND_IRI без текста = 75 символов
# Максимальная длина текста = 1590 - 75 = 1515 символов
text_count=${#cur_text}
[ $text_count -ge 1515 ] && { echo "Превышено максимальное колличество символов - 1515"; exit; }
SAVE_IFS=$IFS
IFS=""
txt_array+=($cur_text)
IFS=$SAVE_IFS
cur_text=""
fi
done
audio_file_names_array=()
# Если текст пустой, то всё равно создаём выходной файл
[ ${#txt_array[@]} -le 0 ] && { txt_array+="."; }
SAVE_IFS=$IFS
IFS=""
file_index=0
for ((i = 0; i < ${#txt_array[@]}; i++)) do
cur_text="${txt_array[$i]}"
let file_index+=1
[ $verbose ] && echo "Часть номер $file_index"
[ $verbose ] && echo "------------------------------"
[ $verbose ] && echo $cur_text
[ $verbose ] && echo "------------------------------"
#[ $verbose ] && echo $cur_text >> "out.txt"
audio_file_name="${input_file}_${file_index}.mp3"
[ $verbose ] && echo -en "\nЗагрузка аудио в файл '$audio_file_name'...\n"
#touch "$audio_file_name"
wget -q -O "$audio_file_name" "http://tts.voicetech.yandex.net/tts?format=mp3&quality=hi&lang=ru_RU&speed=${speed}&speaker=${speaker}&emotion=${emotion}&text=${cur_text}" || { echo "Ошибка при загрузке аудио."; exit; }
[ $verbose ] && echo "Файл '$audio_file_name' загружен."
SAVE_IFS=$IFS
IFS=""
audio_file_names_array+=($audio_file_name)
IFS=$SAVE_IFS
done
[ $verbose ] && echo "Объединяем файлы ${audio_file_names_array[*]} в $out_file"
ffmpeg -f concat -safe 0 -i <(for ((i = 0; i < ${#audio_file_names_array[@]}; i++)) do echo "file '$PWD/${audio_file_names_array[$i]}'"; done) -acodec copy -vcodec copy ${ffmpeg_opt} "$out_file"
for ((i = 0; i < ${#audio_file_names_array[@]}; i++)) do
f="${audio_file_names_array[$i]}"
[ $verbose ] && echo "Удаляем файл '$f'"
rm "$f"
done
IFS=$SAVE_IFS
[ $verbose ] && echo "Конечный файл создан '$out_file'!"