Летопись МИФИ

Торжественное схождение с ума


ЕГЭ-2024
Тесты ЕГЭ Онлайн
Задачи ЕГЭ по математике
Решения ЕГЭ по математике

Вступительные экзамены и специальности
Фишки для Корума:
а б в г д е ё ж з и й к л м н о п р с т у ф х ц ч ш щ ъ ы ь э ю я
a b c d e f g h i j k l m n o p q r s t u v w x y z

Рейтинг пользователей Корума
Настроение • Модераторы
Темы • Картина дня • Realtime
Прочие фишки:
Нецензурная брань
Народная орфография
Морзянка онлайн • Калькулятор
Анаграммы • Игра в города

Загрузка календаря

Новые записи

20.05Задача про фермера и его кредит
26.01Актуализация сервисов ЕГЭ по математике 2014 года
05.11Поломалось
28.08Смена парадигмы
18.07Как вести себя в приличном обществе, предварительно обмочив штаны
оглавление »

Лучшие записи

1.Математическое порно1563
2.Ответы ко всем задачам ЕГЭ по математике 2010 года793
3.Тесты ЕГЭ Онлайн515
4.Результаты ЕГЭ по математике368
5.Результаты ЕГЭ по русскому языку268

О чем тут?

NX VBAB Webometrics igjhs А1-08 Абитуриенты Бачинский ВКонтакте Ващенифтему Волга Диплом Дрессировка преподов Дума ЕГЭ Жизнь Забабахал Инновации История Кафедра 26 Кларк Корум Лженаука МИФИ МИФИсты Морзянка НИЯУ Нанотехнологии Наука Образование Омоймоск ПЦ Поздравляю Поиск Президент Преподы Приколы Программное обеспечение Рейтинги Русский язык Сессия Смерть Статистика Стихи Сувениринг Тест Учеба Учебные материалы ФЯУ Физтех Фотки Ядерщики матанализ

Комментарии

День памяти
  20 мая 2023 (мифи умер)

Задача про фермера и его кредит
  20 мая 2023 (Алекс)

Математическое порно
  22 марта 2023 (Angleton)

Российский Союз ректоров
  19 февраля 2023 (Hellen Paul )

В помощь юному радисту: Морзянка 1.0
  13 ноября 2022 (Сергей)

Знахари и шаманы в МГТУ имени Баумана
  5 ноября 2021 (монах из кельи)

Зачет по инженерной графике
  24 августа 2020 (Инженерная графика)

Пасынки Вселенной
  18 февраля 2020 (Max Brown)

Финансовая пирамида за 10 рублей
  7 февраля 2020 (Флора Миллс)

База решений задач ЕГЭ по математике
  26 декабря 2019 (Мария)

$kib@t®onЪ
Сейчас на скибатроне
Шедевры
26 июля 2010, 04:56:43

А в знаменатель мы добавим единичку

Такой вот пост, что называется, не для всех. Ну, сами посудите: не у каждого нынче найдётся в хозяйстве знаменатель, да ещё такой, в который можно вот так запросто добавить единичку.

Для тех, кого по какой-то причине не отпугнул заголовок, отдельно сообщу, что на повестке дня — вопрос ранжирования неких условных элементов по результатам бинарных (равно как и любых дискретных) пользовательских оценок. Ну вот, наконец-то, все разбежались.

Так вот, на каждом первом веб-сайте полно всякой однотипной хрени. И на каждом полуторном для пользователей так или иначе реализована возможность эти хрени оценивать. Интерактив, знаете ли, в нашу вебдванольную эру весьма почитаем почтеннейшей публикой. По результатам всенародного (или частичнонародного, тут уж как вздумается творцам и самодержцам интернет-ресурсов) голосования строятся рейтинги. Скажем, «десять лучших хреней ударной пятилетки» и тэпэ.

Как построить рейтинг — зависит, конечно, прежде всего от того, как пользователям предлагается голосовать. Тут, по большому счёту, есть ровно два с половиной различных подхода.

Подход первый, академический. На пользователя взваливается титанический труд сделать мучительный выбор между, как правило, пятью оценками — как правило, от 1 до 5. Подход используется весьма широко. Вот, например, самый что ни на есть классический вариант реализован у нас в «Перлах преподавателей»:

Пятибалльная система оценивания

Как правило, «общая оценка» (параметр, по которому строится рейтинг) в этом случае представляет собой просто средний балл из числа полученных голосов. Тут-то и порылась собака. Ведь что при этом получается: некое гениальнейшее творение добрая сотня человек в едином порыве оценивает высшим баллом, а один, скажем, просто из чувства противоречия ставит кол. Средний балл в итоге — 4.96. Другое (быть может, самое что ни на есть посредственное) получает единственную шальную пятёрку, что ставит её на высшую ступень рейтинга. Плохо.

Чтобы избежать таких неприятностей, можно, конечно, «принимать в рейтинг» только элементы, получившие не менее скольких-то-там голосов, но по мне это чистое мракобесие. Вообще, программируя что-либо, следует по возможности избегать констант, взятых с потолка. А предел количества голосов в этом случае именно оттуда всегда и берётся.

Кстати, вот эта вот пяти-(десяти-, восьмидесятидевяти-, и вообще)балльность сама по себе тоже всегда берётся с того же самого потолка. И школьно-институтская традиционность её нисколько не оправдывает.

Подход второй, бинарный. Пользователю предлагается всю широчайшую гамму чувств от прочитанного/увиденного выразить одним из двух доступных способов: либо понравилось (+1), либо нет (-1). Используется столь же широко, как и первый вариант. Вот, скажем, в «Цитатнике Рунета»:

Бинарная система оценивания

В этом случае общей оценкой почти всегда является простая сумма всех полученных голосов. Как нетрудно догадаться, собака порылась и тут, причём точно такая же, но другая. 1000 голосов «за» и 950 голосов «против» (по всей видимости, что-то весьма посредственное) дают точно такой же результат, как и 50 голосов «за» и ни одного «против» (куда более перспективно). Что тоже далеко не айс.

Вскользь упомяну Подход второй с половиной, унарный, когда пользователю предоставлена в безраздельное пользование одна-единственная кнопка — «понравилось», и ему остаётся лишь решить, нажимать её, или нет. Такие порядки царят, скажем на «IT happens». Казалось бы, чем проще — тем лучше. Но нет, тут всё совсем плохо.

Во-первых, пользователь чувствует себя обделённым и глубоко несчастным, не имея возможности сказать своё веское «ацтой». Во-вторых, например, итоговая сумма «50» может получиться и у гениальнейшего творения, волею судеб просмотренного ровно 50-ю посетителями, и у некой посредственности, увиденной многими тысячами.

Последний рассмотренный случай не заслужил номера «3» по причине своей ущербности и хронической неизлечимости от недостатков. Первые же два лечатся. И не чем иным, как той самой единичкой в знаменателе, ради которой автор этих строк наколотил выше почти 4000 знаков.

Общая оценка = {Сумма голосов}/({Количество голосов} + 1)

Вот так просто и первый, и второй методы оценивания/ранжирования избавляются от пагубной зависимости от количества голосов.

Пока эта нехитрая идея у меня тут внедрена только в «Шедеврах скибатронной живописи» (большая цифирь — это как раз та самая оценка, только для красивости ещё умноженная на 100).

При определении пятёрки моих лучших (по мнению читателей) записей пока используется простая сумма голосов, по которой далеко вперёд вырвалось весьма спорное со всех точек зрения, но шибко раскрученное «Математическое порно». Но если взять на вооружение всё написанное выше, то лидерство перехватят куда более высокохудожественные «Финита ля год» и «Простудифилис и гриппер», а «порно» сдвинется аж на 29-ю позицию. Что зело любо моей поэтической натуре.

P.S. Вообще-то, я просто хотел написать о том, что уже практически помер от жары, и что уснуть нихрена не получается. Ну да ладно.
FaceBook

ранее:
Самая поздняя в истории стоянка дикого человека
далее:
Православный инновационный центр

Уже 7 комментариев

вверхвниз
1. megora, 26 июля 2010, 13:21:04
Спасибо, полезно =)

2. Chameleon, 26 июля 2010, 13:59:45
(5+1)/3 против (5+1)/2
(50+1)/12 против (50+1)/11
(500+1)/102 против (500+1)/11

В чем, собственнно, разница?
Да, 5/2 будет хуже, чем (50+1)/12

Но это же тоже некая константа. Почему взята именно она? Почему ты не взял 10? 18?

3. Chameleon, 26 июля 2010, 14:01:40
Пусть 10:
5/11 будет хуже (50+1)/21

4. Lexxus, 26 июля 2010, 14:53:12
(5+1)/3 против (5+1)/2
(50+1)/12 против (50+1)/11
(500+1)/102 против (500+1)/11

В чем, собственнно, разница?
Да, 5/2 будет хуже, чем (50+1)/12

При большом количестве голосов разницы, и правда, нет. Но если речь идёт о первых единицах, то разница существенна.
1/1 и 100/100 - это ведь не должно быть одно и то же, верно?
А 1/2 и 100/101 - уже существенно различается, что и требуется.

Но это же тоже некая константа. Почему взята именно она? Почему ты не взял 10? 18?

Если V - сумма голосов, а N - количество проголосовавших, то V/N - это текущий средний балл.
А V/(N+1) - это математическое ожидание** этой величины при поступлении (N+1)-го, ещё неизвестного нам голоса, который, как мы считаем, может быть любым с равной вероятностью.

Если вместо единицы мы возьмём любое другое натуральное число K, то рейтинговой оценкой будет матожидание среднего после N+K-го голоса. Чем больше K, тем больше неопределённость, и тем менее достоверна будет оценка.

Так что, беря минимальное возможное K=1, мы с одной стороны, вносим необходимую неопределённость, а с другой - максимизируем достоверность оценки.

**) Вообще-то, в числителе к V нужно прибавить ещё среднее из всех возможных голосов. При оценке +1/-1 это ноль. А если, скажем, пользователь выставляет от 1 до 5 баллов, то матожидание на N+1-м шаге равно (V+3)/(N+1), на K-м шаге - (V+3K)/(N+K).

5. Mikl Kolts, 26 июля 2010, 17:59:27
Уважаемый Lexxus!
Скорее, скорее выпейте воды и отправляйтесь в прохладный погреб. Вам перегрело "моск".
Спасение интернет-сообщества от неверных систем оценки, конечно, дело хорошее со всех точек зрения, но, поверьте, Ваш уникальный интеллект и взгляд на мир достоен обратить своё внимание на более философские проблемы.
Спасите себя от самоуничтожения и нас от потери Вас!
челом бьёт

6. Chameleon, 27 июля 2010, 14:53:05
Lexxus, у тебя уже адепты появляются. )))

7. Lexxus, 27 июля 2010, 15:22:19
Lexxus, у тебя уже адепты появляются. )))

Этот адепт - кого надо адепт.
Старинный, заслуженный.


Рейтинг блогов



 

откуда • куда • где • eureka!
Бездарно потраченное время:
105825 дней