데이터 분석 입문을 위한 기초적인 파이썬 내용을 다룹니다. 데이터 분석은 주로 파이썬의 라이브러리인 판다스를 활용해 이루어지며, 이를 위해 기본적인 파이썬 개념에 대한 이해가 필요합니다. 하지만 이것은 파이썬을 완벽하게 숙달해야 한다는 의미는 아닙니다. 그렇기에 판다스와 데이터 분석에 입문할 수 있도록 핵심 파이썬 개념을 간략하게 제공할 것입니다.
2. 변수
변수의 개념
변수명은 데이터를 참조하기 위해 붙이는 이름이며, 변수명으로 지정되어 메모리에 저장된 데이터를 참조하는 것을 변수라고 합니다. 수학 시간에 배웠던 미지수를 떠올리면 쉽게 이해할 수 있습니다. 파이썬에서 변수를 사용하면 변수명을 통해 해당 데이터에 접근할 수 있습니다. 변수로 지정할 수 있는 데이터의 종류는 숫자, 문자열 등 다양하며, 추후 여러분이 데이터 분석 모듈(예: 판다스 라이브러리)을 학습하시면 하나의 표도 변수로 지정할 수 있어 매우 편리합니다.
# 코드 1-1. 변수 x에 값 10을 할당
x = 10
변수를 선언하는 방법은 간단합니다. 변수명을 지정하고 등호(=)를 사용해 데이터를 할당하면 됩니다. 파이썬은 변수를 지정할 때 자료형을 명시할 필요가 없으며, 변수에 저장된 데이터의 자료형에 따라 자동으로 처리됩니다.
변수를 사용하는 이유
변수는 데이터를 저장하고 관리하기 위해 이름을 부여함으로써 데이터를 재사용하고 효율적으로 관리할 수 있도록 돕습니다. 이를 통해 코드의 가독성이 높아지고 유지보수가 더욱 편리해집니다.
# 코드 1-2. 변수를 사용하는 이유: 편의성
# 소수점 10자리의 원주율을 변수 pi로 지정
pi = 3.1415926535
# 반지름이 3인 원의 원주 계산 (2 * 원주율 * 반지름)
2 * pi * 3
6.28318530
변수의 업데이트
변수에 저장된 값을 수정하거나 새로운 값을 할당하는 과정을 변수의 업데이트라고 합니다. 파이썬에서는 기존 변수에 새로운 값을 간단히 할당하여 쉽게 업데이트할 수 있습니다. 아래 예제는 변수 x를 업데이트하는 방법을 보여줍니다.
# 코드 1-3. 변수의 업데이트
# 변수 x에 10을 할당
x = 10
# x에 20을 할당해 업데이트
x = 20
x # 변수 x 출력: 20
기존 변수의 값을 활용하여 변수를 업데이트할 수도 있습니다. 이 방법은 데이터를 동적으로 처리하고 변수의 값을 효율적으로 변경하는 데 유용합니다.
# 코드 1-4. 기존 변수의 값을 활용해 변수 업데이트
# 변수 x에 10을 할당
x = 10
# x에 1을 더하여 업데이트
x = x + 1
# print 함수로 결과 출력
print(x) # 출력: 11
축약 할당 연산자를 사용하면 기존 변수의 값을 더욱 간편하게 업데이트할 수 있습니다. 예를 들어, x = x + 1은 x += 1과 동일한 코드입니다.
# 코드 1-5. 축약 할당 연산자를 사용해 [코드 1-4]와 동일한 결과 얻기
# 변수 x에 10을 할당
x = 10
# x에 1을 더하여 업데이트 (축약 할당 연산자 += 사용)
x += 1
# print 함수로 결과 출력
print(x) # 출력: 11
축약 할당 연산자에는 `+=` 외에도 `-=`, `*=`, `/=` 등이 있습니다. 이러한 연산자는 주로 반복문과 같은 제어문에서 사용되지만, 반복문을 자주 사용하지 않는 데이터 분석 모듈(예: 판다스 라이브러리)에서는 거의 사용되지 않습니다.
변수명을 지정하는 규칙
파이썬에서 변수명을 지정할 때 몇 가지 규칙을 지켜야 합니다.
- 첫 글자는 문자나 언더스코어(_)를 사용해야 합니다. 변수명에 숫자가 포함될 수 있으나, 변수명의 첫 글자로 숫자는 불가합니다. 이후에는 문자, 숫자, 언더스코어를 조합할 수 있습니다.
- 대소문자를 구분합니다. 예를 들어, df와 Df는 서로 다른 변수로 인식됩니다. 소문자를 사용하는 것이 일반적입니다.
- 파이썬의 키워드나 함수명은 변수명으로 사용할 수 없습니다. 예를 들어, True, False, if, print 등은 변수명으로 사용할 수 없습니다.
스네이크 표기법 (snake_case)
변수명은 스네이크 표기법을 따르는 것이 권장되며, 이 방식에서는 모든 문자를 소문자로 작성하고 단어 간 구분은 언더스코어(_)를 사용합니다.
스네이크 표기법에 대한 자세한 내용은 다음 링크를 참고하세요.
판다스를 활용한 변수와 데이터 프레임
※ 판다스는 기초 파이썬과 직접 관련이 없으므로, 추후 판다스를 학습한 후에 확인하셔도 됩니다.
판다스의 데이터 프레임을 변수로 지정할 때는 주로 데이터 프레임의 약자인 df를 사용합니다. 예를 들어, df, df1, df_stock과 같은 변수명을 자주 사용하며, 이를 통해 데이터 프레임을 쉽게 식별하고 관리할 수 있습니다.
유튜브에서 판다스 강의 중입니다.
'판다스 > 기초 파이썬' 카테고리의 다른 글
[python] 3.3. 자료형 - 문자열 (0) | 2024.10.30 |
---|---|
[python] 3.2. 자료형 - 실수 (4) | 2024.10.28 |
[python] 3.1. 자료형 - 정수 (3) | 2024.10.28 |
[python] 1. 코드의 작성, 실행 및 출력 (2) | 2024.10.27 |
[python] 0. 파이썬 시작하기 (6) | 2024.10.27 |