Генератор текста на основе цепей Маркова на php

Если общая сумма ваших покупок у продавца Zillion больше чем:
- 922628 ₽ скидка составит 25%
- 461314 ₽ скидка составит 20%
- 92263 ₽ скидка составит 15%
- 46131 ₽ скидка составит 10%
- 9226 ₽ скидка составит 5%

Всего продано 22
Возвратов 0
Хороших отзывов 3
Плохих отзывов 0

Генератор текста на основе цепей Маркова. php скрипт
На основе заранее подготовленного текста генерирует случайный.
Схема работы. Сначала загружается файл "text.txt", он должен быть в кодировке win-1251 (в принципе utf-8 тоже работает, только необходимо все файлы перевести в кодировку utf-8). Скрипт удаляет все символы, кроме букв и некоторых знаков препинания, затем вырезает лишние пробелы. Полученный (чистый текст) разделяется на отдельные слова. Теперь есть отдельные звенья цепи. Определяет связи слов (какие слова и за какими могут располагаться). Это самый ресурсоемкий процесс, так что на больших файлах придется подождать. Если генерация требуется часто, то, наверное, имеет смысл уменьшить минимальную и максимальную длину текста (в примере это цифры 200-мин и 600-макс). Дальше определяются слова, с которых начинаются предложения. И на последнем этапе составляется предложения.
Кому интересна теория - https://ru.wikipedia.org/wiki/Цепь_Маркова