Minz's Wiki
首页 归档 分类 标签 关于
首页 归档 分类 标签 关于

categories  

  •   MySQL
    •   基础学习
      • 一条MySQL语句的执行详析
      • MySQL数据库 - 初步认识
      • MySQL中如何对留存进行分析?
    •   练习题集
      • MySQL练习 - 场景模拟初级篇(持续更新)
      • MySQL练习 - 基础篇(持续更新ing)
      • HackerRank中SQL练习非简单部分
      • HackerRank中SQL练习_简单
  •   Python
    •   基础函数
      • python数据类型 - 字符串
      • python数据类型 - 列表与字典
    •   库的使用
      • Matplotlib - 常用图表 & python表格样式
      • Seaborn - 基础风格展示 & 调色盘
  •   分析基础
    •   业务指标
      • 到底什么是数据指标?
      • 数据分析中的度量和维度
      • 什么是趋势分析、特征工程、因子分析 ?
    •   分析框架
      • A/B 测试的概念认识
      • 一眼就get到数据分布情况的图表?
      • 同期群分析
      • 框架下的指标
      • 快速了解数据分布的常用方法
      • 如何通过对比得出数据差异?以及什么是二八定律
      • 什么是正态分布?如何进行正态性检验?
      • 数据的相关性分析 & 统计分析
      • 如何用图表直观显示数据的分布情况?
    •   数据清洗
      • 数据分析中的数据清洗流程
    •   算法
      • 什么是监督学习和非监督学习?
      • 随机算法之蒙特卡罗
  •   工具搭建
    • jupyter-notebook 安装&美化
  •   折腾记录
    •   ArchLinux
      • archlinux的常用操作命令
    •   Hexo
      • Hexo搭建博客&选择主题
    • 如何使用you-get获取视频?
  •   数据案例分析
    • 电商项目:母婴用品购买行为分析
    • 对比分析案例:IMDB电影数据分析及可视化
    • 泰坦尼克号幸存者分析
    • 某壳网房屋租赁信息抓取与浅析
    • 会员用户消费行为浅度挖掘
    • 用户消费有哪些特征?用户质量又如何界定?
    • 剖析天猫双十一的美妆产品销售数据
    • 员工离职原因分析
    • 大型商场销售额分析
  •   认知提升
    • 如何过上真正有效的生活 -- 查理·芒格
    • 查理芒格的100个思维模型
  • Welcome Minz's DA_Wiki Site

数据清洗

数据分析中的数据清洗流程

2021-08-25
分析基础数据清洗
数据清洗
Minz © 2023 Creative Commons License
Powered by Hexo. Theme - wikitten
6955  |  5251
Posts
查理芒格的100个思维模型

原文来自:芒格学院 1. 机会成本 思维模型 “机会成本是指为了得到某种东西而所要放弃另一些东西的最大价值;也可以理解为在面临多方案择一决策时,被舍弃的选项中的

如何过上真正有效的生活 -- 查理·芒格

原文来自:The Munger Operating System: How to Live a Life That Really Works The Munge

jupyter-notebook 安装&美化

下载 推荐使用 Anaconda ,理由如下: anaconda 包含了新的python3版本,以及jupyter notebook,还有spyder IDE

HackerRank中SQL练习_简单

简单 题目来源于 Hackerrake easy 部分,解题部分的注释为问题拆解过程,收录原因是这些题目是基础的 SELECT 中常用的基本函数的使用场景,故记

HackerRank中SQL练习非简单部分

NO Easy The PADS 题目 Generate the following two result sets: Query an alphabetica

MySQL练习 - 基础篇(持续更新ing)

摘要 MySQL练习题,一些常用的基础知识点的练习… MySQL - 简易篇 重复值查找 [题目] 编写一个SQL查询,查找学生表中所有重复的学生名。 1234

archlinux的常用操作命令

记录archlinux的常用操作命令 系统语言 12345678#存放在/etc/locale-genvim /etc/locale-gen #将需要的语言去掉

Hexo搭建博客&选择主题

搭建基础 git 安装 直接 github 上下载,拖到 theme 文件夹中也能用,但这样还不如不搭建 基本linux命令 mkdir xxx ll cd …

如何用图表直观显示数据的分布情况?

摘要 数据分布可视化图表绘制,包括直方图、密度图、柱状图、折线图的一些实例~ 写在前面 今天主要聊聊关于数据分布情况的可视化所用到的一部分图表 什么是分布数据:

Welcome Minz's DA_Wiki Site

这是 Minz 的个人 Wiki 站点,主要记录一些自己总结的只言片语的零散知识点。 本站信息 Wiki主要记录关于数据分析的技能学习的笔记类文章,好记性不如烂

大型商场销售额分析

摘要 根据销售额数据分析整个大型商场的销售情况,以及转化为可视化图表~ 项目描述 项目名称:大型商场销售额分析及数据可视化 数据来源:该项目提供了从不同城市的1

员工离职原因分析

摘要 利用员工离职数据从不同维度分析员工离职的种种原因,Hr的不时之需~ 项目描述 项目名称:人力资源分析 - 离职原因 数据来源:数据来源于Kaggle中的人

什么是趋势分析、特征工程、因子分析 ?

摘要 关于数据分析中的趋势分析、特征工程、因子分析这些专有名词的基本概念~ 前言 以下为数据分析过程中常见的一些专用名词解析,记录下来以便随时翻阅,并进行查漏补

随机算法之蒙特卡罗

摘要 随机算法的基础认知以及简单推导应用~ 随机算法 蒙特卡罗算法 蒙特卡罗算法,又称随机抽样或统计实验方法,是以概率和统计理论方法为基础的一种计算方法 使用随

什么是监督学习和非监督学习?

摘要 监督学习与非监督学习的基本认识,以及常用的几种基础算法的介绍~ 前言 本文将记录下学习数据分析中几个最为常见的基本算法,先来了解一下其算法概念 监督学习

数据的相关性分析 & 统计分析

摘要 怎样判别数据中的变量是否存在相关性? 得到数据样本又如何进行整理归档? 前言 前面两篇文章列举了数据特征分析中的三种常见的分析方法:分布分析、对比分析和帕

什么是正态分布?如何进行正态性检验?

摘要 什么是正态分布,以及检验数据样本的正态性的方式有哪些? 前言 本文记录学习正态分布以及数据特征的正态性检验。 正态分布 正态分布,又名高斯分布,是一个非常

MySQL中如何对留存进行分析?

摘要 关于留存的基本概念认知,以及在MySQL中如何对留存进行分析的场景模拟… 留存的基本概念 关于界定/标准 新增 = 新 + 增,理论上在处于一个流程内的不

MySQL练习 - 场景模拟初级篇(持续更新)

摘要 MySQL练习题,基于不同的场景模拟进一步加强MySQl知识点练习~ MySQL练习 - 场景模拟初级篇 薪水涨幅升序 [题目] 现在有两个表: 雇员表:

如何通过对比得出数据差异?以及什么是二八定律

摘要 如何得出数据的差异?如何通过二八定律定位问题的决定性因素? 写在前面 上次学习了数据特征分析中的分布分析,今天继续学习数据特征分析中另外两种分析方法,也就

快速了解数据分布的常用方法

摘要 介绍几种数据分析中对于数据分布的常用方式,包括极差、频率以及分组的使用实例~ 前言 分布分析是数据特征分析中极为常用的一种方法。在数据质量得到保证的前提下

数据分析中的度量和维度

摘要 通过业务指标,了解数据分析中的度量和维度到底是什么? 写在前面 数据分析和运营脱离不开关系。业务的洞悉决定了数据分析结果的上限,数据技巧只是逼近它。so,

同期群分析

同期群分析 什么是同期群分析 同期群的定义:在一定的时间窗口内,有共同行为特征的一群人 时间和行为是根据业务要求进行自定义,从而选择合适的时间和行为口径 举例:

框架下的指标

市场营销指标 1、客户/用户生命周期 ​ 企业/产品和消费者在整个业务关系阶段的周期 ​ 不同业务划分的阶段不同。传统营销中,分为潜在用户,兴趣用户,新客户,老

数据分析中的数据清洗流程

预处理阶段 1、数据导入 2、查看数据。这里包含两个部分:一是看源数据,包括字段解释、数据来源、代码表等等一切描述数据的信息;二是抽取一部分数据,使用人工查看方

一眼就get到数据分布情况的图表?

摘要 数据分布可视化图表绘制,包括散点图、蜂窝图、箱型图、小提琴图、LV图表的一些实例~ 前言 上篇文章介绍了数据分布情况的可视化的四种图表 (直方图、密度图、

Seaborn - 基础风格展示 & 调色盘

摘要 Seaborn库的使用,包括一些基础风格的参数设置,以及调色盘(各色系的设置)~ 写在前面 Matplotlib试着让简单的事情更加简单,困难的事情变得可

Matplotlib - 常用图表 & python表格样式

摘要 Matplotlib库的使用,包括常用图表的绘制,以及表格样式 前言 Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平

python数据类型 - 列表与字典

摘要 python数据类型之列表(List)&字典(Dictionary),基础特性以及常用场景~ 写在前面 上篇博文介绍了python中最基本的数据类

python数据类型 - 字符串

摘要 python数据类型之字符串(String),基础特性以及常用场景~ 前言 这篇文章主要介绍python在数据分析中的字符串的常用魔法,结合实例形式总结字

MySQL数据库 - 初步认识

摘要 有关MySQL数据库的基础知识,包括一些专用名称解析以及必会知识点,有待更正与完善~ 初识MySQL数据库 我们在编写任何程序之前,都需要事先写好基于网络

一条MySQL语句的执行详析

摘要 从常用的MySQL关键字到MySQL语句的书写,再到MySQL语句的执行,一步步深入学习MySQL~ MySQL常用的关键字 必选字段:SELECT、FR

剖析天猫双十一的美妆产品销售数据

摘要 深度挖掘天猫双十一时刻的美妆产品销售数据,分析各品牌之间的销量、热度、价格等~ 项目描述 项目名称:天猫双十一美妆产品销售数据分析 数据来源:数据来源于网

A/B 测试的概念认识

摘要 深入了解什么是数据指标?以及数据指标的作用和分类~ A/B 测试中的测试说的是什么 测试的重要性 测试是数据分析中的最常用的一种手段 早期选定的目标往往是

到底什么是数据指标?

摘要 深入了解什么是数据指标?以及数据指标的作用和分类~ 什么是好的数据指标? 好的数据指标能带来你所期望的变化。 以下是一些衡量数据指标好坏的重要准则: 好的

用户消费有哪些特征?用户质量又如何界定?

摘要 借由在线音乐零售平台CDNow的部分用户消费数据,分析用户的消费特征、用户的消费质量等~ 项目描述 项目名称:CDNow在线音乐零售平台用户消费行为分析

如何使用you-get获取视频?

摘要 关于you-get的简单使用,方便获取网络上部分视频~ 项目描述 今天分享一个各大网站视频下载方法(封装好的pacong)。 目的是为了能够将视频下载到本

会员用户消费行为浅度挖掘

摘要 通过会员消费数据,分析消费趋势、复购率以及回购率等;并给会员用户进行分层,给后续工作提供数据依据~ 项目描述 项目名称:健身平台会员用户消费行为分析 数据

某壳网房屋租赁信息抓取与浅析

摘要 收集整合房屋租赁信息,并加以简单的分析及可视化~ 项目描述 项目背景:最近在为租房的事情所烦恼,在网站上寻找各种房源信息,看的眼花缭乱。萌生了将房源基本信

泰坦尼克号幸存者分析

摘要 通过泰坦尼可号幸存者数据,分析幸存者的特征,从而… 项目描述 项目名称:泰坦尼克号生存分析 数据来源:Kaggle数据集 → 共有1309名乘客数据,其中

对比分析案例:IMDB电影数据分析及可视化

摘要 对比分析IMDB部分电影数据,包括电影类型、产地、原创&改编、评分&票房之间的关系等~ 项目描述 项目名称:电影分析可视化 数据来源:数据

电商项目:母婴用品购买行为分析

摘要 通过母婴类产品客户购买行为数据分析,找出核心的用户群,并分析整理销量的趋势,找出其中需要改进的环节~ 项目描述 项目名称:母婴用品数据分析 数据来源:数据

Pages
关于我

个人信息 90后一枚,对感兴趣的东西都尝试去学,故学的杂偶有精 信息管理与信息系统专业 爱好:运动、数独、炉石传说 联系方式:wong_minz@163.com

Categories
Tags
Categories
认知提升认知提升
工具搭建工具搭建
MySQLMySQL
练习题集MySQL/练习题集
折腾记录折腾记录
ArchLinux折腾记录/ArchLinux
Hexo折腾记录/Hexo
分析基础分析基础
分析框架分析基础/分析框架
数据案例分析数据案例分析
业务指标分析基础/业务指标
算法分析基础/算法
基础学习MySQL/基础学习
数据清洗分析基础/数据清洗
PythonPython
库的使用Python/库的使用
基础函数Python/基础函数
Tags
认知提升认知提升
工具搭建工具搭建
MySQLMySQL
MySQL,练习题MySQL-练习题
Linux,ArchLinuxLinux-ArchLinux
HexoHexo
Python,可视化Python-可视化
DA ProjectDA-Project
业务指标业务指标
基础算法基础算法
算法基础算法基础
相关性分析相关性分析
统计分析统计分析
正态性检验正态性检验
对比分析,二八定律对比分析-二八定律
数据分布数据分布
分析框架分析框架
数据清洗数据清洗
Python库Python库
Python,数据类型Python-数据类型
A/B-testA-B-test
数据指标数据指标
you_getyou-get