pandas의 Series
pandas의 Series는 1차원 배열 형태의 자료구조로, 인덱스(index)를 가지며 데이터(data)를 저장합니다. Python의 리스트, 넘파이 배열, 딕셔너리 등을 기반으로 생성할 수 있습니다. pandas에서 데이터를 다룰 때 가장 기본이 되는 자료구조 중 하나입니다.

✅ 1. Series의 주요 특징
1차원 데이터 (숫자, 문자열, 파이썬 객체 등)
인덱스(index)를 사용하여 각 데이터를 식별
인덱스를 사용하여 데이터에 접근 가능
자동 인덱싱 또는 사용자 지정 인덱스 지원
📝 2. Series 생성 방법
import pandas as pd
# 리스트를 사용한 Series 생성
data = pd.Series([10, 20, 30, 40])
print(data)
출력 결과:
0 10
1 20
2 30
3 40
dtype: int64
왼쪽 숫자는 자동 생성된 인덱스(index)입니다.
오른쪽 숫자는 데이터(data)입니다.
dtype은 데이터 타입을 의미합니다 (int64, float64, object 등).
🏷 3. 사용자 지정 인덱스 사용하기
data = pd.Series([10, 20, 30, 40], index=['a', 'b', 'c', 'd'])
print(data)
출력 결과:
a 10
b 20
c 30
d 40
dtype: int64
인덱스를 숫자가 아닌 문자열로 지정할 수도 있습니다.
🔍 4. Series 데이터 접근 및 슬라이싱
# 특정 값 접근
print(data['b']) # 결과: 20
# 슬라이싱
print(data['a':'c'])
슬라이싱 출력 결과:
a 10
b 20
c 30
dtype: int64
딕셔너리처럼 키(index)로 접근할 수 있고, 슬라이싱도 지원합니다.
💡 5. Series와 딕셔너리 유사성
Series는 Python의 dict와 비슷하게 동작합니다. 인덱스를 키처럼 사용하여 데이터를 다룰 수 있습니다.
# in 연산자를 사용한 존재 여부 확인
print('a' in data) # True
print('e' in data) # False
📚 6. Series 메서드와 속성
values: 데이터 배열 반환 (넘파이 배열)
index: 인덱스 객체 반환
head(n): 상위 n개의 데이터 반환
tail(n): 하위 n개의 데이터 반환
sum(), mean(), max(), min() 등의 수치 계산 메서드 사용 가능
print(data.values) # [10 20 30 40]
print(data.index) # Index(['a', 'b', 'c', 'd'], dtype='object')
print(data.mean()) # 평균값 계산 -> 25.0
🌟 요약
pandas.Series는 1차원 데이터와 인덱스를 가지는 자료구조입니다.
리스트, 넘파이 배열, 딕셔너리 등으로부터 쉽게 생성할 수 있습니다.
데이터 분석에서 열(column) 단위 데이터를 다루는 데 유용하게 사용됩니다.
'십대를 위한 코딩 > 십대를 위한 파이썬' 카테고리의 다른 글
Windows에서 특정 폴더에서 Jupyter Notebook을 실행하는 방법 (0) | 2025.03.01 |
---|---|
코드 분석: NaN 값 포함 데이터 개수 확인 (1) | 2025.02.27 |
행렬(Matrix)이란? (2) | 2025.02.24 |
벡터의 크기와 방향이란? (0) | 2025.02.23 |
파이썬 리스트 vs 넘파이 배열(Numpy ndarray) 차이 (1) | 2025.02.22 |