본문 바로가기
Programming/Python

[Pandas] Series

 

실질적으로 DF를 많이 쓰지 Series를 자주 사용하지 않는다.

 

Series = 1차원 리스트 (엑셀 열 1개)

# 시리즈 만들기
s = pd.Series(['amy',170,240])
s.index
s

 

 

0    amy
1    170
2    240
dtype: object

 

type(s) -> pandas.core.series.Series

 

# 시리즈 인덱스 지정하기
s.index = ['name','height','footsize']

# 시리즈 인덱스 가져오기 or 확인하기
s.index

Index(['name', 'height', 'footsize'], dtype='object')

 

 

 

# 시리즈 데이터 확인하기
s.values

array(['amy', 170, 240], dtype=object)

 

 

 

통계값 출력하기

 

s2 = pd.Series([10,20,30,40,50])   # value가 모두 숫자형일 때만 可
print('평균:',s2.mean())
print('최소값:',s2.min())
print('최대값:',s2.max())
print('중간값:',s2.median())
print('표준편차:',s2.std())

평균: 30.0
최소값: 10
최대값: 50
중간값: 30.0
표준편차: 15.811388300841896

 

s2.describe()    # 요약통계함수

count     5.000000
mean     30.000000
std      15.811388
min      10.000000
25%      20.000000
50%      30.000000
75%      40.000000
max      50.000000
dtype: float64

 

 

그외 주요 정렬법

s3 = pd.Series([1,3,2,4,10])

# s3의 value 중 10을 5로 교체
s3 = s3.replace(10,5)
s3



# s3 정렬 (디폴트는 오름차순 : ascending=True)
s3.sort_values()



s3.sort_values(ascending=False)

 

 

 

시리즈 형태로 컬럼명 기반 데이터 추출한다면? (앞선 csv파일 기준)

조건: 컬럼명은 1개만 지정 可, 대괄호는 1개만 사용. 컬럼명에 공백 특수문자 있으면 사용 불가

 

# 'name'컬럼 추출하기
s_name = df['name']
s_name.head(3)

0      Aiden
1    Charles
2     Danial
Name: name, dtype: object

 

 

# index
s_name.index

RangeIndex(start=0, stop=30, step=1)

 

 

# values
s_name.values

array(['Aiden', 'Charles', 'Danial', 'Evan', 'Henry', 'Ian', 'James',
       'Julian', 'Justin', 'Kevin', 'Leo', 'Oliver', 'Peter', 'Amy',
       'Chloe', 'Danna', 'Ellen', 'Emma', 'Jennifer', 'Kate', 'Linda',
       'Olivia', 'Rose', 'Sofia', 'Tiffany', 'Vanessa', 'Viviana',
       'Vikkie', 'Winnie', 'Zuly'], dtype=object)

 

 

# shape
s_name.shape

(30,)

 

 

# 'eng'컬럼 추출하기
df.eng

0      90.0
1      80.0
2     100.0
3     100.0
4      35.0
5     100.0
6      75.0
7      90.0
8      60.0
9     100.0
10     95.0
11     75.0
12     95.0
13     75.0
14    100.0
15    100.0
16     60.0
17     65.0
18     55.0
19      NaN
20     90.0
21     70.0
22     65.0
23    100.0
24      NaN
25     70.0
26     80.0
27     50.0
28    100.0
29     90.0
Name: eng, dtype: float64

 

# 'matn'컬럼 추출하기
df["math"].head(3)

0     95.0
1     75.0
2    100.0
Name: math, dtype: float64

 

 

 

 

 

728x90
반응형

'Programming > Python' 카테고리의 다른 글

[Pandas] 문제풀이 1  (0) 2023.08.29
[Pandas] 데이터 추출(loc, iloc)  (0) 2023.08.29
[Pandas] 기본 DF 생성, 출력 확인, 컬럼명 기반 추출  (0) 2023.08.29
[Python] API(json, xml)  (1) 2023.08.22
[Python] web scraping  (0) 2023.08.21