실질적으로 DF를 많이 쓰지 Series를 자주 사용하지 않는다.
Series = 1차원 리스트 (엑셀 열 1개)
# 시리즈 만들기
s = pd.Series(['amy',170,240])
s.index
s
0 amy
1 170
2 240
dtype: object
type(s) -> pandas.core.series.Series
# 시리즈 인덱스 지정하기
s.index = ['name','height','footsize']
# 시리즈 인덱스 가져오기 or 확인하기
s.index
Index(['name', 'height', 'footsize'], dtype='object')
# 시리즈 데이터 확인하기
s.values
array(['amy', 170, 240], dtype=object)
통계값 출력하기
s2 = pd.Series([10,20,30,40,50]) # value가 모두 숫자형일 때만 可
print('평균:',s2.mean())
print('최소값:',s2.min())
print('최대값:',s2.max())
print('중간값:',s2.median())
print('표준편차:',s2.std())
평균: 30.0
최소값: 10
최대값: 50
중간값: 30.0
표준편차: 15.811388300841896
s2.describe() # 요약통계함수
count 5.000000
mean 30.000000
std 15.811388
min 10.000000
25% 20.000000
50% 30.000000
75% 40.000000
max 50.000000
dtype: float64
그외 주요 정렬법
s3 = pd.Series([1,3,2,4,10])
# s3의 value 중 10을 5로 교체
s3 = s3.replace(10,5)
s3
# s3 정렬 (디폴트는 오름차순 : ascending=True)
s3.sort_values()
s3.sort_values(ascending=False)
시리즈 형태로 컬럼명 기반 데이터 추출한다면? (앞선 csv파일 기준)
조건: 컬럼명은 1개만 지정 可, 대괄호는 1개만 사용. 컬럼명에 공백 특수문자 있으면 사용 불가
# 'name'컬럼 추출하기
s_name = df['name']
s_name.head(3)
0 Aiden
1 Charles
2 Danial
Name: name, dtype: object
# index
s_name.index
RangeIndex(start=0, stop=30, step=1)
# values
s_name.values
array(['Aiden', 'Charles', 'Danial', 'Evan', 'Henry', 'Ian', 'James',
'Julian', 'Justin', 'Kevin', 'Leo', 'Oliver', 'Peter', 'Amy',
'Chloe', 'Danna', 'Ellen', 'Emma', 'Jennifer', 'Kate', 'Linda',
'Olivia', 'Rose', 'Sofia', 'Tiffany', 'Vanessa', 'Viviana',
'Vikkie', 'Winnie', 'Zuly'], dtype=object)
# shape
s_name.shape
(30,)
# 'eng'컬럼 추출하기
df.eng
0 90.0
1 80.0
2 100.0
3 100.0
4 35.0
5 100.0
6 75.0
7 90.0
8 60.0
9 100.0
10 95.0
11 75.0
12 95.0
13 75.0
14 100.0
15 100.0
16 60.0
17 65.0
18 55.0
19 NaN
20 90.0
21 70.0
22 65.0
23 100.0
24 NaN
25 70.0
26 80.0
27 50.0
28 100.0
29 90.0
Name: eng, dtype: float64
# 'matn'컬럼 추출하기
df["math"].head(3)
0 95.0
1 75.0
2 100.0
Name: math, dtype: float64
'Programming > Python' 카테고리의 다른 글
[Pandas] 문제풀이 1 (0) | 2023.08.29 |
---|---|
[Pandas] 데이터 추출(loc, iloc) (0) | 2023.08.29 |
[Pandas] 기본 DF 생성, 출력 확인, 컬럼명 기반 추출 (0) | 2023.08.29 |
[Python] API(json, xml) (1) | 2023.08.22 |
[Python] web scraping (0) | 2023.08.21 |