искровые мл немеченого скоринг данные

голоса
0

Редакция: Для данных с этикетками, мы можем использовать LabeledPoint для обучения и тестирования. Тем не менее, если у меня есть dataframe немеченых данных, что это лучший способ найти вероятность, что принадлежит к какому классу (предположит бинарную классификацию)?

Предположим, что dataframe выглядит

# Из DataPoint | Функция 1 | Функция 2 | ... | Характеристика 1000 |

а размерность функций такой же, что и LabeledPoints в процессе обучения. Весь код в Scala с искровым 2.x.

Задан 02/07/2017 в 21:33
источник пользователем
На других языках...                            

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more