Признаки эти вполне прозаичные, например, наиболее часто используемые глаголы, знаки препинания, сокращения, тема, стиль повествования и тому подобное. На примере книг уже ставшими бестселлерами авторы системы тестировали показатели, в итоге из огромного количества таких показателей выбрали, что-то около двух тысяч значимых. На основе их и создали свой "Код бестселлера" или "бестселлометр", который присваивает числовой индекс вероятности стать бестселлером для любой рукописи.
Авторы книги, они же создатели этой компьютерной системы Джоди Арчер и Мэттью Л. Джокерс. Джоди Арчер прежде работала редактором-рецензистом в издательстве Penguin Books, откуда ушла для прохождения аспирантуры по английскому языку в Стэндфордском университете. Её соавтор Мэттью Джокерс в это время был лектором в Стэндфордском университете и сооснователем Стэндфордской литературной мастерской.
Джоди обратилась к Мэттью с исследовательскими вопросами - Отчего романы становятся бестселлерами? Почему читатели читают? Почему именно эти книги, а ни другие? Мэттью данные вопросы показались интересными, к тому времени он как раз закончил свою часть работы над исследованием авторского стиля текста «Книга мормона» с помощью компьютера. Эта работа над определением авторства и стилеметрией убедила Мэтта в том, что компьютеры видят многое и помогают нам обнаружить в тексте то, чего мы обычно не замечаем.
Дальнейшие исследования позволили Мэтту создать компьютерную программу, которая с точностью 82% определяла пол автора всего лишь по его или ее манере использовать самые простые слова английского языка, такие как the и of. Мэтт не первым заметил, что у авторов-мужчин и авторов-женщин – разные стилевые привычки, ещё он обнаружил, что, опираясь лишь на использование слова the, компьютер может достаточно уверенно определить, английский это писатель или американский.
С этого началось их совместное исследование и создание бестселлометра, о том, как оно проходило и какие были получены результаты, как раз и повествует книга "Код бестселлера". Насколько полезны эти исследования для писателя или для издателя, не берусь судить, но как минимум интересно. Хотя, конечно, некоторые аспекты выглядят "притянутыми за уши", а порой и комичными.
Например, в отношении общеупотребительных слов, если, допустим, книга была переведена, то, как быть, чьи особенности речи считает этот бестселлометр - автора или переводчика. К примеру, слово "хотя", которое может быть переведено как "but" то есть "но". Ведь, авторы анализируют бестселлеры только на английском языке, интересно было бы почитать о таком исследовании в отношении русской литературы, или верней для бестселлеров, написанных на русском языке. Для иллюстрации приведу цитату из статьи Бродского, где он пишет о творчестве Достоевского:
"Что до хитросплетений, то русский язык, в котором подлежащее часто уютно устраивается в конце предложения, а суть часто кроется не в основном сообщении, а в его придаточном предложении, - как бы для них и создан. Это не аналитический английский с его альтернативным "или/или", - это язык придаточного уступительного, это язык, зиждущийся на "хотя". Любая изложенная на языке этом идея тотчас перерастает в свою противоположность, и нет для русского синтаксиса занятия более увлекательного и соблазнительного, чем передача сомнения и самоуничижения" конец цитаты.
Это всего лишь один, из множества вопросов вызывающих сомнение. Возможно, потому что тема любого языка, просто необъятна, вряд ли её можно свести к простым алгоритмам. С другой стороны, почему нет, как я уже писал выше, интерес вызывает.
Ещё показался интересным список в конце книги, создатели системы сгенерировали его в количестве ста романов, с которым они настоятельно просят ознакомиться только после прочтения. Всё началось с вопроса, какой роман бестселлерометр считает лучшим. И вот, по мнению компьютера, лучшей книгой среди всех опубликованных за последние тридцать лет оказалась «Сфера» Дэйва Эггерса.
И далее, был составлен весь список по убыванию. Такая трактовка, то есть, по мнению компьютера, мне показалась достаточно интересной и в некотором роде объективной и в целом поучительной. У кого ещё учится писать бестселлеры, как не у признанных мастеров, они-то и составили основное ядро списка со своими наиболее лучшими и характерными произведениями, по мнению компьютера, разумеется.