반응형
Pandas
판다스(pandas)는 파이썬의 데이터 분석 라이브러리이다.
- 특징
-수치형 테이블과 시계열 데이터를 조작하고 운영하기 위한 데이터를 제공
-시리즈(1차원 배열)와 데이터프레임(2차원 배열)이라는 구조화된 데이터 형식을 제공
-목적: 여러 가지 유형의 데이터를 공통의 포맷으로 정리하는 것
시리즈(Series): 1차원 배열의 순차적으로 나열된 데이터 형태로, 키와 값이 일대일 대응된다.{key:value}
# 판다스 설치
pip install pandas
먼저 판다스를 사용하기 위해서는 프롬프트에 pandas를 설치를 해야한다.
# 라이브러리 불러오기
import pandas as pd
# 딕셔너리 -> 시리즈
# key:value 구조의 딕셔너리 생성, data에 저장
data = {'a':1,
'b':2,
'c':3}
# 판다스 Series() 함수로 data를 시리즈로 변환 -> sr1에 저장
sr1 = pd.Series(data)
print(sr1)
>>>
a 1
b 2
c 3
dtype: int64
# 튜플 -> 시리즈
tup = ('123','abc','가나다')
# 인덱스 지정해서 출력
sr2 = pd.Series(tup)
print(sr2)
>>>
0 123
1 abc
2 가나다
dtype: object
키에 해당하는 값이 없기 때문에 인덱스를 지정해주지 않으면 정수형 위치 인덱스가 자동 지정된다
# 리스트 -> 시리즈
lst = ['123','abc','가나다']
sr3 = pd.Series(lst, index=['숫자','영어','한글'])
print(sr3)
>>>
숫자 123
영어 abc
한글 가나다
dtype: object
# 시리즈 인덱스
idx = sr3.index
print(idx)
>>> Index(['숫자', '영어', '한글'], dtype='object')
만약 인덱스를 설정하지 않아 정수형 위치 인덱스가 자동 지정되었다면 RangeIndex(start=0, stop=3, step=1) 로 출력
# 데이터 값 배열
val = sr3.values
print(val)
>>> ['123' 'abc' '가나다']
# 시리즈 원소의 자료형
rint(sr3.dtype)
>>> object
# 시리즈 형태
print(sr3.shape)
>>> (3,)
shape는 배열의 형태를 나타내며 (행의 수,열의 수) 형식으로 출력된다.
그러나 시리즈는 1차원구조로 (n,)의 형태로 출력된다
# 원소 선택
print(sr3[0])
>>> 123
print(sr3['한글'])
>>> 가나다
# 여러 개의 원소 선택
# 정수형 위치 인덱스로 원소 선택
print(sr3[[1,2]])
>>>
영어 abc
한글 가나다
dtype: object
# 인덱스 이름으로 원소 선택
print(sr3[['숫자','한글']])
>>>
숫자 123
한글 가나다
dtype: object
# 슬라이싱으로 원소 선택
print(sr3[0:2])
>>>
숫자 123
영어 abc
dtype: object
반응형
'Python' 카테고리의 다른 글
| [Python/파이썬]Pandas : DataFrame(판다스 : 데이터프레임)1 (0) | 2025.01.15 |
|---|---|
| [Python/파이썬] IF응용 (코딩도장-자릿수를 출력하는 프로그램) (0) | 2024.12.03 |
| [Python/파이썬] Random을 이용해 로또번호 추출하기 (0) | 2024.12.02 |
| [Python/파이썬] Random (0) | 2024.12.02 |
| [Python/파이썬] 함수(Function)1 (0) | 2024.11.07 |