Faster Pandas: Make your code run faster and consume less memory| Miki Tebeke, CEO 353solutions.

https://www.youtube.com/watch?v=d9YfwxuaylI&ab_channel=PyData

1. Why Performance is Important?

A. Cloud Cost (If you consume more less CPU, less Memory, then you can save the more cloud cost)

B. We can save the Time taken to complete experiment.

C. Viability of code production

2. Why shouldn't we optimize?

A. Development Time

3. magic function

- %time

- %timeit

- %paste

- %%prun

So, always try to vectorize what you can.

But Sometimes you can't.

Pandas is column oriented.

4. Technique

A. 비교

numpy가 왠만하면 더 빠름

%timeit max(df['total_amount'])

%timeit df['total_amount'].max()

%timeit df['total_amount'].values.max()

B. Numpy가 좋긴 하지만.. 주의해야 함

s = pd.Series([1, np.nan, 3])

s.sum()

s.values.sum()

위에는 4가 나오고

아래는 nan이 나옴

만약 numpy로 합을 보고 싶다면 np.nanmax같은 함수 써야함.

5. Memory Usage

저작자표시 비영리 변경금지

'CS > Python&R' 카테고리의 다른 글

데이터 드리븐 리포트 (0)	2023.11.15
알고리즘 인사이드 with 파이썬 (0)	2023.11.08
Pandas SettingWithCopyWarning (0)	2022.10.31
F-strings In Python: Everything You Need To Know (0)	2022.09.10
[통계청X슬기로운 통계생활] MDIS 데이터 친해지기 2-1강 - 통계지표 계산과정 이해하기 (0)	2022.08.22

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

UGONG2SAN

Faster Pandas: Make your code run faster and consume less memory| Miki Tebeke, CEO 353solutions.

1. Why Performance is Important?

2. Why shouldn't we optimize?

3. magic function

4. Technique

5. Memory Usage

'CS > Python&R' 카테고리의 다른 글

댓글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

Faster Pandas: Make your code run faster and consume less memory| Miki Tebeke, CEO 353solutions.

1. Why Performance is Important?

2. Why shouldn't we optimize?

3. magic function

4. Technique

5. Memory Usage

'CS > Python&R' 카테고리의 다른 글

관련글

댓글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역