Подготовка факторов ... Подготовка факторов Кодирование категориальных факторов Дана таблица со следующими факторами: «Десятилетие» — десятилетие XX века, когда был выпущен фильм. «Студия» — код киностудии, которая занималась производством фильма. «Продолжительность» — продолжительность фильма в минутах. «Место съёмок, город» — город, в котором происходили съёмки фильма. «Литературная основа» — правда ли, что в основу фильма легло литературное произведение. «Число зрителей» — число зрителей фильма в кинопрокате. Десятилетие Студия Продолжительность, минуты Место съёмок, город Литературная основа Число зрителей 60 -е ABC 107 Москва Нет 25000000 60 -е ABC 83 Ленинград Да 29000000 50 -е CDE 99 Старая Ладога Да 14000000 80 -е FGH 115 Самара Нет 13000000 По имеющимся данным необходимо научиться предсказывать число зрителей фильма. Вопросы-ответы по тексту Фактор, который может принимать только одно из двух значений — либо «Да», либо «Нет», — принято называть не категориальным, а бинарным. Кодирование бинарных факторов в численное представление происходит по очень простому принципу: значению «Нет» сопоставляется 0 , а значению «Да» — 1 . Определите тип каждого из факторов, которые представлены в данных. Верно «Десятилетие» «Студия» «Продолжительность, минуты» «Место съёмок, город» «Литературная основа» «Число зрителей» бинарный категориальный категориальный, имеющий порядок численный Далее Вопросы-ответы по задаче Для каждого из факторов определите все подходы (их может быть несколько), которые было бы уместно применить для его кодирования в численное значение. Если фактор численный, то соотнесите его с подходом «Кодирование не требуется». Например, категориальный фактор «Жанр фильма» можно закодировать двумя способами: «Завести под каждую категорию новую колонку...» и целевое кодирование. При этом способ «Упорядочить все возможные категории...» не подходит, потому что у жанров нет естественного порядка. «Десятилетие» «Студия» «Продолжительность, минуты» Перевести значение «Нет» в 0 , а значение «Да» — в 1 Упорядочить все возможные категории и сопоставить каждую из них её номеру в общем списке Завести под каждую категорию новую колонку, в которой значение 0 соответствует тому, что объект не принадлежит данной категории, а значение 1 — тому, что принадлежит Целевое кодирование Кодирование не требуется Ответить Вопросы-ответы по задаче Для каждого из факторов определите все подходы (их может быть несколько), которые было бы уместно применить для его кодирования в численное значение. Если фактор численный, то соотнесите его с подходом «Кодирование не требуется». Например, категориальный фактор «Жанр фильма» можно закодировать двумя способами: «Завести под каждую категорию новую колонку...» и целевое кодирование. При этом способ «Упорядочить все возможные категории...» не подходит, потому что у жанров нет естественного порядка. «Место съёмок, город» «Литературная основа» «Число зрителей» Перевести значение «Нет» в 0 , а значение «Да» — в 1 Упорядочить все возможные категории и сопоставить каждую из них её номеру в общем списке Завести под каждую категорию новую колонку, в которой значение 0 соответствует тому, что объект не принадлежит данной категории, а значение 1 — тому, что принадлежит Целевое кодирование Кодирование не требуется
Ответ нейросети
31 января 2025 12:44
Понравился ответ?
Задай свой вопрос
Напиши любую задачу или вопрос, а нейросеть её решит



