Транскрипт сломан настолько, что делать из него «сверхподробное саммари» — это будет на 80% выдумка.
Что реально видно:
- Это тайскоязычное интервью с Митио Каку (Dr. Michio). Whisper плохо распознал тайский и почти полностью развалил английскую часть.
- Огромные куски — зацикленный мусор: «The big bang. The big bang. The big bang...», «It's a world. It's a world...», «Thank you. Thank you...», «The reason why. The reason why...». Это не речь, это галлюцинации модели на тишине/музыке/тайском.
- Якоря
[1:26:05](https://youtu.be/opB7_JXL0LA?t=5165)тут ставить некуда — большинство «дословных фраз» в SRT либо повторяющийся бред, либо неотличимы друг от друга. Линки будут вести в случайные места. - Тематика угадывается крупными мазками: Большой взрыв, теория струн, 11 измерений, тёмная материя, варп-драйв и Альфа Центавра, типы цивилизаций (I/II/III), квантовые компьютеры и угроза для биткоина, теломеры и старение, UFO/UAP, AI в физике, ИИ-агенты. Личное: интервьюер в детстве собирал в гараже мамы установку для генерации антиматерии (классическая байка Каку про коллайдер на 22 мили проводов в гараже).
Но связной нити, цитат, фактов с цифрами и фреймворков из этого SRT извлечь нельзя без додумывания. Если я сделаю саммари — половина пунктов будет придумана мной по тому, что Каку обычно говорит, а не по тому, что в этом конкретном видео.
Что предлагаю:
- Перегнать заново через нормальный whisper с правильным языком (
--language thесли оригинал тайский, или с лучшей моделью —large-v3минимум). Текущий SRT, похоже, сделан на маленькой модели без указания языка. - Если есть ссылка на YouTube — могу попробовать вытащить официальные субтитры (часто у тайских каналов есть свои, нормальные).
- Если есть тайская дорожка отдельно — её транскрибировать и потом перевести, выйдет в разы чище.
Что хочешь сделать?