以下程式請在安裝pandas套件下,在 jupyter notebook 的 python 執行;
程式撰寫: 以斯帖統計顧問公司 Python課程講師 蔡勝雄老師(Amos)
#先寫入一組資料,並將date轉成日期格式
import pandas as pd
patients = [
['A01', '20010108'],
['A01', '20010618'],
['A01', '20020507'],
['A02', '19991211'],
['A02', '20001019'],
['A03', '20020306']
]
df = pd.DataFrame(patients,columns=['id', 'date'])
df['date'] = pd.to_datetime(df['date'])
歸戶
# 求最早看診日期,以此產生歸戶結果
df.groupby('id').first()
結果
定義最後看診日期
# 求最後看診日期
df.groupby('id').last()
結果
定義第幾次就醫
# 求每人累計看診次數
df['no'] = df.groupby(['id']).cumcount()+1
df
結果
定義門診就醫三次以上
# 就診次數超過3次以上
df.loc[df['no'] >= 3]
結果
文章標籤
全站熱搜