Публикации по теме 'data'
Ценный анализ данных с помощью Pandas Value Counts
Ценный анализ данных с помощью Pandas Value Counts
Вы можете проводить больше анализа данных, чем вы думаете, с помощью этого простого инструмента.
Функция value_counts() в популярной библиотеке науки о данных Python Pandas - это быстрый способ подсчета уникальных значений в одном столбце, также известном как ряд данных.
Эта функция чрезвычайно полезна для очень быстрого выполнения базового анализа данных для определенных столбцов данных, содержащихся в Pandas DataFrame. Для..
Начало работы с машинным обучением с помощью Python
Привет, ребята, сегодня я расскажу вам о машинном обучении. Машинное обучение - это отрасль искусственного интеллекта (ИИ) и информатики , которая фокусируется на использовании данных и алгоритмов для имитации того, как люди учатся, с постепенным повышением его точности. Это метод анализа данных, который автоматизирует построение аналитических моделей. Это захватывающий предмет, который откроет ваши мысли не только о цветах, вы узнаете, как отправлять много информации на свою машину,..
Сокращение больших наборов данных для задач машинного обучения при сохранении соотношения меток
Часто мы сталкиваемся с наборами данных, которые имеют чрезвычайно большое количество точек данных. Без уменьшения размера таких данных существует высокая вероятность того, что большинству алгоритмов потребуются большие вычислительные мощности, объем памяти, память и вычислительные возможности. По сути, эти требования могут быть невыполнимы для каждого человека и особенно для студентов, которые работают с такими данными для практики или в учебных целях.
В такой ситуации возникает..
Отношение шансов делает то, что не дает коэффициент риска - интуитивный пример
"Статистика"
Отношение шансов делает то, что не дает коэффициент риска - интуитивный пример
Понять концепцию с нуля
Давайте начнем с основного вывода этого блога:
«Отношение шансов является последовательным показателем как для статистики населения, так и для статистики выборки (исследования случай-контроль со значительным эффектом), где соотношение рисков показывает несоответствие»
Теперь у нас возникает вопрос: почему это так?
Я докажу это на соответствующем примере, чтобы..
Что такое методология науки о данных?
Что такое методология науки о данных?
Методологию можно определить как систему методов, используемых в той или иной области изучения или деятельности. Это метод исследования концепции фокусных точек. Теперь давайте посмотрим на «методологию» с точки зрения науки о данных.
Вам дается какая-то проблема. Каким должен быть ваш подход?
› Какую проблему вы пытаетесь решить?
› Как вы можете использовать данные, чтобы ответить на вопрос?
Теперь поработайте с данными:
› Какие данные вам..
Лассо-регрессия
Регрессия Лассо, также известная как регуляризация L1, представляет собой метод линейной регрессии, который добавляет штрафной член к функции потерь, пропорциональный абсолютному значению весов модели. Это побуждает модель изучать разреженные веса, что может помочь с выбором признаков и интерпретируемостью.
В регрессии Лассо функция потерь определяется как:
потеря = сумма((y — Xw)**2) + альфа * сумма(abs(w))
где y — целевой вектор, X — матрица признаков, w — вектор весов, а..
Обработка данных — WeRateDogs
Для проекта по обработке данных в Udacity Data Analyst Nanodegree нам предоставляется возможность пройти процесс анализа данных после прохождения курса. Это второй, который фокусируется на процессе обработки данных, который включает в себя; сбор данных, оценка данных и очистка данных. В этом проекте перед нами стояла задача загрузить данные из Audacity вручную и программно, используя запросы из библиотеки запросов python, а также собрать данные из Twitter API, очистить и проанализировать..