【職問 數據分析】

1、統計學知識

均值、中值、衆數、最大最小值、方差、標準差數據庫

 一、正態分佈

 二、相關

 

如圖,Y軸和X軸存在相關性,X越大,Y越大。所以花粉數量和防曬霜銷量呈正相關機器學習

 三、迴歸

 

 

 

 

 

 

 

2、Excel

Vlookup函數

 3、數據庫

文本類型學習

 數值類型spa

 日期類型3d

 一、建立、調整、刪除表

#生成數據表結構
create table users(
    user_id int primary key,
    name varchar(20),
    age int,
    city varchar(20),
    state varchar(20),
    monthly_active int
);

#描述表結構
describe users;

#刪除表
drop table users;

#再次建立表:1、主鍵放最後聲明;2、加上name非空、city惟一的限制;3、設置city缺省值
create table users(
    user_id int,
    name varchar(20) not null,
    age int,
    city varchar(20) unique default 'unknown',
    state varchar(20),
    monthly_active int,
    primary key(user_id)
);

#調整數據表:增長字段、刪除字段
alter table users add gender char(1);
alter table users drop column gender;

二、增刪改

2.一、 insertcode

# 1、向空表插入數據
insert into users values 
(1,'Jack',19,'Dallas','Texas',22),
(2,'Lucy',20,'Boston','Massachusetts',15),
(3,'Tom',13,'Los Angeles','California',8),
(4,'Alice',22,'San Jose','California',17),
(5,'Zhang',32,'Chicago','Illinois',22);

#2、向指定列添加數據 
INSERT INTO users (user_id,age,city,state,monthly_active) VALUES (1,19,'Dallas','Texas',22);

2.二、 deleteblog

# 刪除符合某種條件的記錄
DELETE FROM users WHERE user_id=4;
DELETE FROM users WHERE monthly_active<15;

2.三、 updateci

UPDATE users SET state='CA' WHERE state='California';
UPDATE users SET name='Jackie',age=29 WHERE user_id=1;

三、其餘

3.一、 COUNT函數數據分析

COUNT(1)=COUNT(*),統計全部的記錄

COUNT(列名),列名中爲NULL的忽略不計

3.二、 ER圖

 4、Python

一、基本數據類型

 

 1)Number

id=1000           #int類型
deposit=2013.88   #float類型
is_male=True      #bool類型
com=2013.88+1000j #複數類型 

2)String

3)List

 

 

 

 

4)Tuple

列表用[]定義,元組用()定義;列表內容可修改,元組不可修改

tup1 = () # 空元組
tup2 = (20,) # 一個元素,須要在元素後添加逗號
tup3 = (100000, 100001, 100002, 100003, 100004)

5)Set

六、Dictionary

 

 

二、條件控制與循環

 

 

 

 

三、科學計算庫Numpy

四、數據分析處理庫Pandas

五、數據可視化庫Matplotlib

六、Python與SQL的聯動

 

 5、可視化

tableau和AntV

 6、爬蟲

 7、機器學習

 8、商業分析

一、百度財報分析

 

 財報基本概念——三張表(資產負載表、利潤表、現金流量表)

 

 一、2019Q1百度財報總覽

   百度股價相對年初降低40%+

 二、主營業務介紹

  財務分析

  挑戰和機遇

三、新業務和AI戰略業務分析

  愛奇藝業務分析:總體概覽、挑戰、優點和機遇

  DuerOS業務分析:總體概覽、挑戰、機遇

   Apollo無人駕駛業務分析:~

 

 四、基於數據和業務分析的洞察和判斷(建議)

  主營業務-搜索和信息流(用戶端、商業端)

  新業務和AI戰略業務

二、商業分析

 

 一、老闆要什麼

  老闆的職責、你應該交付什麼

二、總體分析,局部分析

  看總體:看主營業務,看其餘

  總體和局部分析後的進一步洞察(總結、結論)

三、看大盤,看競對,看團隊

  看大盤:廣告在GDP的比重,在線廣告和傳統廣告走勢

  看競對:國外Google,騰訊,微博,頭條

  綜合大盤和競對的洞察(總結、結論)

  看團隊

四、造成方案和計劃

  對交付的考慮

  交付方案要點

  方案和計劃組成:目標爲可量化的具體描述(如手機百度DAU從200W到250W)

相關文章
相關標籤/搜索