십대를 위한 코딩/십대를 위한 파이썬

pandas의 Series

forSilver 2025. 2. 25. 21:23
반응형

pandas의 Series

pandas의 Series는 1차원 배열 형태의 자료구조로, 인덱스(index)를 가지며 데이터(data)를 저장합니다. Python의 리스트, 넘파이 배열, 딕셔너리 등을 기반으로 생성할 수 있습니다. pandas에서 데이터를 다룰 때 가장 기본이 되는 자료구조 중 하나입니다.

✅ 1. Series의 주요 특징


1차원 데이터 (숫자, 문자열, 파이썬 객체 등)

인덱스(index)를 사용하여 각 데이터를 식별

인덱스를 사용하여 데이터에 접근 가능

자동 인덱싱 또는 사용자 지정 인덱스 지원


📝 2. Series 생성 방법


import pandas as pd

# 리스트를 사용한 Series 생성
data = pd.Series([10, 20, 30, 40])
print(data)

출력 결과:

0    10
1    20
2    30
3    40
dtype: int64

왼쪽 숫자는 자동 생성된 인덱스(index)입니다.

오른쪽 숫자는 데이터(data)입니다.

dtype은 데이터 타입을 의미합니다 (int64, float64, object 등).


🏷 3. 사용자 지정 인덱스 사용하기


data = pd.Series([10, 20, 30, 40], index=['a', 'b', 'c', 'd'])
print(data)

출력 결과:

a    10
b    20
c    30
d    40
dtype: int64

인덱스를 숫자가 아닌 문자열로 지정할 수도 있습니다.


🔍 4. Series 데이터 접근 및 슬라이싱


# 특정 값 접근
print(data['b'])   # 결과: 20

# 슬라이싱
print(data['a':'c'])

슬라이싱 출력 결과:

a    10
b    20
c    30
dtype: int64

딕셔너리처럼 키(index)로 접근할 수 있고, 슬라이싱도 지원합니다.


💡 5. Series와 딕셔너리 유사성


Series는 Python의 dict와 비슷하게 동작합니다. 인덱스를 키처럼 사용하여 데이터를 다룰 수 있습니다.

# in 연산자를 사용한 존재 여부 확인
print('a' in data)  # True
print('e' in data)  # False


📚 6. Series 메서드와 속성


values: 데이터 배열 반환 (넘파이 배열)

index: 인덱스 객체 반환

head(n): 상위 n개의 데이터 반환

tail(n): 하위 n개의 데이터 반환

sum(), mean(), max(), min() 등의 수치 계산 메서드 사용 가능


print(data.values)   # [10 20 30 40]
print(data.index)    # Index(['a', 'b', 'c', 'd'], dtype='object')
print(data.mean())   # 평균값 계산 -> 25.0


🌟 요약


pandas.Series는 1차원 데이터와 인덱스를 가지는 자료구조입니다.

리스트, 넘파이 배열, 딕셔너리 등으로부터 쉽게 생성할 수 있습니다.

데이터 분석에서 열(column) 단위 데이터를 다루는 데 유용하게 사용됩니다.