Публикации по теме 'data'


Ценный анализ данных с помощью Pandas Value Counts
Ценный анализ данных с помощью Pandas Value Counts Вы можете проводить больше анализа данных, чем вы думаете, с помощью этого простого инструмента. Функция value_counts() в популярной библиотеке науки о данных Python Pandas - это быстрый способ подсчета уникальных значений в одном столбце, также известном как ряд данных. Эта функция чрезвычайно полезна для очень быстрого выполнения базового анализа данных для определенных столбцов данных, содержащихся в Pandas DataFrame. Для..

Начало работы с машинным обучением с помощью Python
Привет, ребята, сегодня я расскажу вам о машинном обучении. Машинное обучение - это отрасль искусственного интеллекта (ИИ) и информатики , которая фокусируется на использовании данных и алгоритмов для имитации того, как люди учатся, с постепенным повышением его точности. Это метод анализа данных, который автоматизирует построение аналитических моделей. Это захватывающий предмет, который откроет ваши мысли не только о цветах, вы узнаете, как отправлять много информации на свою машину,..

Сокращение больших наборов данных для задач машинного обучения при сохранении соотношения меток
Часто мы сталкиваемся с наборами данных, которые имеют чрезвычайно большое количество точек данных. Без уменьшения размера таких данных существует высокая вероятность того, что большинству алгоритмов потребуются большие вычислительные мощности, объем памяти, память и вычислительные возможности. По сути, эти требования могут быть невыполнимы для каждого человека и особенно для студентов, которые работают с такими данными для практики или в учебных целях. В такой ситуации возникает..

Отношение шансов делает то, что не дает коэффициент риска - интуитивный пример
"Статистика" Отношение шансов делает то, что не дает коэффициент риска - интуитивный пример Понять концепцию с нуля Давайте начнем с основного вывода этого блога: «Отношение шансов является последовательным показателем как для статистики населения, так и для статистики выборки (исследования случай-контроль со значительным эффектом), где соотношение рисков показывает несоответствие» Теперь у нас возникает вопрос: почему это так? Я докажу это на соответствующем примере, чтобы..

Что такое методология науки о данных?
Что такое методология науки о данных? Методологию можно определить как систему методов, используемых в той или иной области изучения или деятельности. Это метод исследования концепции фокусных точек. Теперь давайте посмотрим на «методологию» с точки зрения науки о данных. Вам дается какая-то проблема. Каким должен быть ваш подход? › Какую проблему вы пытаетесь решить? › Как вы можете использовать данные, чтобы ответить на вопрос? Теперь поработайте с данными: › Какие данные вам..

Лассо-регрессия
Регрессия Лассо, также известная как регуляризация L1, представляет собой метод линейной регрессии, который добавляет штрафной член к функции потерь, пропорциональный абсолютному значению весов модели. Это побуждает модель изучать разреженные веса, что может помочь с выбором признаков и интерпретируемостью. В регрессии Лассо функция потерь определяется как: потеря = сумма((y — Xw)**2) + альфа * сумма(abs(w)) где y — целевой вектор, X — матрица признаков, w — вектор весов, а..

Обработка данных — WeRateDogs
Для проекта по обработке данных в Udacity Data Analyst Nanodegree нам предоставляется возможность пройти процесс анализа данных после прохождения курса. Это второй, который фокусируется на процессе обработки данных, который включает в себя; сбор данных, оценка данных и очистка данных. В этом проекте перед нами стояла задача загрузить данные из Audacity вручную и программно, используя запросы из библиотеки запросов python, а также собрать данные из Twitter API, очистить и проанализировать..