Python

[Python/파이썬]Pandas : Series(판다스 : 시리즈)

wowstudylog 2025. 1. 8. 22:09
반응형

 

 

Pandas


판다스(pandas)는 파이썬의 데이터 분석 라이브러리이다.

  • 특징

-수치형 테이블과 시계열 데이터를 조작하고 운영하기 위한 데이터를 제공
-시리즈(1차원 배열)와 데이터프레임(2차원 배열)이라는 구조화된 데이터 형식을 제공
-목적: 여러 가지 유형의 데이터를 공통의 포맷으로 정리하는 것

시리즈(Series): 1차원 배열의 순차적으로 나열된 데이터 형태로, 키와 값이 일대일 대응된다.{key:value}

 

 

 

# 판다스 설치

pip install pandas

 

먼저 판다스를 사용하기 위해서는 프롬프트에 pandas를 설치를 해야한다.

 

 

# 라이브러리 불러오기

import pandas as pd

 

 

# 딕셔너리 -> 시리즈

# key:value 구조의 딕셔너리 생성, data에 저장
data = {'a':1,
        'b':2,
        'c':3}
        
# 판다스 Series() 함수로 data를 시리즈로 변환 -> sr1에 저장
sr1 = pd.Series(data)
print(sr1)
>>>
a    1
b    2
c    3
dtype: int64

 

 

# 튜플 -> 시리즈

tup = ('123','abc','가나다')
# 인덱스 지정해서 출력
sr2 = pd.Series(tup)
print(sr2)
>>> 
0    123
1    abc
2    가나다
dtype: object

키에 해당하는 값이 없기 때문에 인덱스를 지정해주지 않으면 정수형 위치 인덱스가 자동 지정된다

 

 

# 리스트 -> 시리즈

lst = ['123','abc','가나다']
sr3 = pd.Series(lst, index=['숫자','영어','한글'])
print(sr3)
>>>
숫자    123
영어    abc
한글    가나다
dtype: object

 

 

 

# 시리즈 인덱스

idx = sr3.index
print(idx)
>>> Index(['숫자', '영어', '한글'], dtype='object')

만약 인덱스를 설정하지 않아 정수형 위치 인덱스가 자동 지정되었다면 RangeIndex(start=0, stop=3, step=1) 로 출력

 

 

# 데이터 값 배열

val = sr3.values
print(val)
>>> ['123' 'abc' '가나다']

 

 

# 시리즈 원소의 자료형

rint(sr3.dtype)
>>> object

 

 

# 시리즈 형태

print(sr3.shape)
>>> (3,)

shape는 배열의 형태를 나타내며 (행의 수,열의 수) 형식으로 출력된다.

그러나 시리즈는 1차원구조로 (n,)의 형태로 출력된다

 

 

# 원소 선택

print(sr3[0])
>>> 123
print(sr3['한글'])
>>> 가나다

 

 

# 여러 개의 원소 선택

# 정수형 위치 인덱스로 원소 선택
print(sr3[[1,2]])
>>>
영어    abc
한글    가나다
dtype: object

# 인덱스 이름으로 원소 선택
print(sr3[['숫자','한글']])
>>>
숫자    123
한글    가나다
dtype: object

# 슬라이싱으로 원소 선택
print(sr3[0:2])
>>>
숫자    123
영어    abc
dtype: object

 

 

 

 

 

반응형