Комментарий от morr

Комментарий #947746
morr

в топике Рекомендации 8 марта 2015

@Luscinia поправил банилку за мат, больше она за эту фразу не будет банить
@Keiken, жанры напрямую не учитываются. если в двух словах, то сайт рекомендует то, что нравится другим людям, которых сайт сочтёт похожими на тебя. похожесть определяется математически по похожести выставляемых оценок.
если более подробно, то смотри ссылки из этого абзаца. pearson_z рекомендации используют pearson correlation coefficient с нормализацией пользовательских оценок по z-score. а svd соответственно svd разложение матрицы пользовательских оценок

Silicium

В часности, очень здорово бы было выводить прогнозную оценку на страницу каждого непосмотренного тайтла

эту оценку можно составить не для всех аниме, и получившаяся оценка не всегда будет попадать в десятибальную шкалу

а ещё это дорого, тоесть долго. чтобы оценку предсказать, надо полный набор рекомендаций составить, перелопатив всю базу пользовательских оценок

Silicium

У меня есть соображения о том, как это вычислять, но я так и не оформил в математический алглритм...

то, о чём ты говоришь(получение вектора характеристик для аниме), делается как раз SVD преобразованием матрицы пользовательских оценок (столбцы - пользователи, колонки - аниме, а на пересечении столбцов и колонок - пользовательские оценки).
при SVD преобразовании матрицы оценок мы как раз получаем три матрицы. одна из которых характеризует пользователей (по ней рекомендации и составляются), вторая единичная, а в третьей находятся характеристики аниме
по тому же алгоритму, каким мы находим похожих пользователей (сравнивая вектора пользовательских коэффициентов), можно для конкретного аниме находить другие похожие аниме. только вот заполняемый пользователями список похожих /animes/22535-kiseijuu-sei-no-kakuritsu/similar намного лучше автоматической генерации

@Dragn, @Silicium°

Ответы

Dragn 8 марта 2015#

morr

только вот заполняемый пользователями список похожих shikimori.org/animes/22535-kiseijuu-sei-no-kakuritsu/similar намного лучше автоматической генерации

Да, и добавить эту функцию на Шики, а то с МАЛа они даже без "описаний почему похоже"...

Silicium° 9 марта 2015#

@morr
А по моему, что-то таки изменилось.
По крайней мере, теперь вижу, что Пирсон-Z работает довольно хорошо:

672x947
А вот SVD как-то не очень...

675x946
Но скорость вычисления стала лучше - буквально 30-40 секунд.
(А он запоминает результаты что ли? А то я один из 10-и бальных тайтлов удалил из списка а в рекомендациях его не вижу)

~~С точки зрения интерфейса, хотелось бы иметь возможность настраивать известность тайтла.~~ Нет, это не поможет. Та же сортировка...
Вообще, алгоритм ведь должен подсказывать такие тайтлы, о которых сам я не знаю. И при этом внушать доверие.
И вот, например, как быть с такими тайтлами как HotoriХотори? Вряд-ли какой нибудь алгоритм мне его посоветовал бы...

Кроме того, есть важный параметр, который, как я понимаю, никак не учитываться - факт непросмотра.
Если почти все посмотрели тайтл N а я нет, то это не менее показательно, чем мои оценки просмотренным тайтлам.
Особенно это заметно при определении похожих пользователей. Два пользователя посмотревшие по 500 тайтлов у которых общих тайтлов 40 штук, имеют очень разные вкусы, даже если эти 40 тайтлов оценены у них примерно одинаково. И наоборот - 85% общих но по разному оценённых тайтлов - признак похожих вкусов.

Оценки не сложно подогнать под 10-и бальную шкалу.
А вот интересные функции, типа "лаборатории" были бы интересны...

Кстати, я вроде спрашивал уже, не помню... Но таки много ли людей пользуется сервисом рекомендаций?

@Oniii-chan, @Vil

Твой комментарий

Комментарий #947746 morr

Комментарий #947746
morr