LinuxScript/Script/txt2mp3_by_yatts

#!/bin/bash
# Общественное достояние, 2024, Алексей Безбородов (Alexei Bezborodov) <AlexeiBv+mirocod_txt2mp3@narod.ru>

# Озвучивание текста из файла

# Параметры по умолчанию
emotion='neutral'
speaker='ermil'
speed='1.0'
verbose=
ffmpeg_opt=""
version=1.0
input_file=""
out_file=""
format="mp3"
quality="hi"
lang="ru_RU"

ShowHelp() {
cat << EOF
Использование: txt2mp3 -i <text_file> [-o <mp3_file>] [-hV]
Озвучивание текста

-h, -help,          --help                  Посмотреть помощь.
-v, -version,       --version               Посмотреть версию программы.
-i, -input,         --input                 Входной текстовый файл.
-o, -output,        --output                Выходной файл звуковой.
-e, -emotion,       --emotion               Эмоциональный настрой говорящего. Может принимать значения "neutral", "good", "evil". По умолчанию "$emotion".
-s, -speaker,       --speaker               Голос говорящего. Может принимать значения "oksana","jane","omazh","zahar","ermil","silaerkan","erkanyavas","alyss", "nick". По умолчанию "$speaker".
-S, -speed,         --speed                 Скорость озвучки. По умолчанию "$speed".
-O, -ffmpeg_opt,    --ffmpeg_opt            Дополнительные параметры ffmpeg.
-f, -format,        --format                Выходной формат. Может быть либо "mp3", либо "wav". По умолчанию "$format".
-q, -quality,       --quality               Качество выходного файла. Может быть либо "hi", либо "lo". По умолчанию "$quality".
-l, -lang,          --lang                  Язык озвучки. По умолчанию "$lang".
-V, -verbose,       --verbose               Подробный вывод.
EOF
}

# $@ is all command line parameters passed to the script.
# -o is for short options like -v
# -l is for long options with double dash like --version
# the comma separates different long options
# -a is for long options with single dash like -version
# Example
# 'h' is a no-value option.
# 'v:' implies that option -v has value and is a mandatory option. ':' means has a value.
# 't::' implies that option -t has value but is optional. '::' means optional.


options=$(getopt --long "help,version,verbose,input:,output:,emotion:,speaker:,speed:,ffmpeg_opt:,format:,quality:,lang:" -o "hvVi:o:e:s:S:O:f:q:l:" -a -- "$@")

# set --:
# If no arguments follow this option, then the positional parameters are unset. Otherwise, the positional parameters
# are set to the arguments, even if some of them begin with a ‘-’.
eval set -- "$options"

while true
do
case "$1" in
-h|--help)
    ShowHelp
    exit
    ;;
-v|--version)
    echo $version
    exit
    ;;
-V|--verbose)
    verbose=true
    ;;
-i|--input)
    input_file="$2"
    ;;
-o|--output)
    out_file="$2"
    ;;
-e|--emotion)
    emotion="$2"
    ;;
-s|--speaker)
    speaker="$2"
    ;;
-S|--speed)
    speed="$2"
    ;;
-O|--ffmpeg_opt)
    ffmpeg_opt="$2"
    ;;
-f|--format)
    format="$2"
    ;;
-q|--quality)
    quality="$2"
    ;;
-l|--lang)
    lang="$2"
    ;;
--)
    shift
    break;;
esac
shift
done

unuse_param="$*"
if [ "${input_file}" = "" ] || [ "$unuse_param" != "" ]; then
    [ "$unuse_param" != "" ] && echo "Параметры не расшифрованы \"$unuse_param\""
    ShowHelp
    exit
fi

[ "$out_file" = "" ] && { out_file="$input_file.mp3"; [ $verbose ] && echo "Выходное имя файла \"$out_file\""; }

source_text=$(cat "${input_file}")

# Удаляем все пробелы в начале и в конце строк и заменяем два и более пробелов на один, удаляем все непечатаемые символы
source_text="$(echo "${source_text//[$'\t\r\n']}" | sed 's/^ *//;s/[ ^]*$//;s/  */ /;s/[^[:blank:][:print:]]//g')"

#[ $verbose ] && echo "Исходный текст $source_text" >> "out.txt"

ping -c 3 ya.ru &>/dev/null || { echo "Интернет недоступен."; exit; }

split_size=1450
[ $verbose ] && echo "Длина текста ${#source_text}: Разбиваем на части по $split_size"

txt_array=()

space_char=" "
for ((i=1;i<=${#source_text};i++)); do
    cur_char=${source_text:$i-1:1}
    cur_text="${cur_text}${cur_char}"
    if [ "$cur_char" = "$space_char" ] && [ ${#cur_text} -ge $split_size ] || [ $i = ${#source_text} ]; then

        # Максимальная длина SEND_IRI - 1590 символов, длина SEND_IRI без текста = 75 символов
        # Максимальная длина текста = 1590 - 75 = 1515 символов
        text_count=${#cur_text}
        [ $text_count -ge 1515 ] && { echo "Превышено максимальное колличество символов - 1515"; exit; }

        SAVE_IFS=$IFS
        IFS=""
        txt_array+=($cur_text)
        IFS=$SAVE_IFS

        cur_text=""
    fi
done

audio_file_names_array=()

# Если текст пустой, то всё равно создаём выходной файл
[ ${#txt_array[@]} -le 0 ] && { txt_array+="."; }

SAVE_IFS=$IFS
IFS=""
file_index=0
for ((i = 0; i < ${#txt_array[@]}; i++)) do
    cur_text="${txt_array[$i]}"

    let file_index+=1
    [ $verbose ] && echo "Часть номер $file_index"
    [ $verbose ] && echo "------------------------------"
    [ $verbose ] && echo $cur_text
    [ $verbose ] && echo "------------------------------"

    #[ $verbose ] && echo $cur_text >> "out.txt"

    audio_file_name="${input_file}_${file_index}.mp3"

    [ $verbose ] && echo -en "\nЗагрузка аудио в файл '$audio_file_name'...\n"

    #touch "$audio_file_name"
    wget -q -O "$audio_file_name" "http://tts.voicetech.yandex.net/tts?format=mp3&quality=hi&lang=ru_RU&speed=${speed}&speaker=${speaker}&emotion=${emotion}&text=${cur_text}" || { echo "Ошибка при загрузке аудио."; exit; }

    [ $verbose ] && echo "Файл '$audio_file_name' загружен."

    SAVE_IFS=$IFS
    IFS=""
    audio_file_names_array+=($audio_file_name)
    IFS=$SAVE_IFS
done

[ $verbose ] && echo "Объединяем файлы ${audio_file_names_array[*]} в $out_file"

ffmpeg -f concat -safe 0 -i <(for ((i = 0; i < ${#audio_file_names_array[@]}; i++)) do echo "file '$PWD/${audio_file_names_array[$i]}'"; done) -acodec copy -vcodec copy ${ffmpeg_opt} "$out_file"

for ((i = 0; i < ${#audio_file_names_array[@]}; i++)) do
    f="${audio_file_names_array[$i]}"
    [ $verbose ] && echo "Удаляем файл '$f'"
    rm "$f"
done
IFS=$SAVE_IFS

[ $verbose ] && echo "Конечный файл создан '$out_file'!"