以下程式請在安裝pandas套件下,在 jupyter notebook 的 python 執行;

程式撰寫: 以斯帖統計顧問公司 Python課程講師 蔡勝雄老師(Amos)

 

#先寫入一組資料,並將date轉成日期格式 

import pandas as pd

patients = [
['A01', '20010108'],
['A01', '20010618'],
['A01', '20020507'],
['A02', '19991211'],
['A02', '20001019'],
['A03', '20020306']
]

df = pd.DataFrame(patients,columns=['id', 'date'])
df['date'] = pd.to_datetime(df['date'])

 

   歸戶  

 

# 求最早看診日期,以此產生歸戶結果
df.groupby('id').first()

 

結果

 

image

 

   定義最後看診日期  

 

# 求最後看診日期
df.groupby('id').last()

 

結果

image

 

   定義第幾次就醫   

 

# 求每人累計看診次數
df['no'] = df.groupby(['id']).cumcount()+1
df

 

結果

image

 

   定義門診就醫三次以上   

 

# 就診次數超過3次以上
df.loc[df['no'] >= 3]

 

結果

image

arrow
arrow
    創作者介紹
    創作者 estat 的頭像
    estat

    以斯帖統計顧問公司

    estat 發表在 痞客邦 留言(0) 人氣()