오늘은 앞 시간에 파이썬 이론 중 다루지 못했던 Iterator, Generator 관련 내용을 간단히 배우고, 이후부터는 쭉 하나의 데이터를 통해 분석하고 시각화하는 과정을 진행해보았습니다.이 날 진행되었던 데이터 분석 프로젝트는 다음 글에 상세히 작성되어 있습니다! [데이터 분석] 한국복지패널 데이터부트캠프 기간 중 진행되었던 데이터 분석 프로젝트들은 따로 분리해서 관리하고자 합니다!우선 전에 진행했던 프로젝트들을 정리한 후, 추후 진행될 프로젝트들도 정기적으로 올려보도록 하injoycode.tistory.com ♾️ Iterator✨ Iterator가 뭐시냐면...데이터를 순차적으로 접근할 수 있는 객체입니다.일반적으로 for 문과 함께 사용되며, 한 번에 하나의 요소를 반환하면서 다음 요소로 이동..
오늘은 그동안 배웠던 파이썬 이론들 중에서 보완이 필요한 부분을 추가로 배우고, 실습하는 과정을 통해 주요 함수들의 사용법, 패키지나 예외 처리 등에 대해 깊게 알아갈 수 있었습니다. 🔖 문자열 포매팅문자열 포매팅은 은행권, 통신사, 청구서 등에 주로 사용되는 기법입니다.문자열을 포매팅할 때는 다음과 같은 여러 코드들이 사용될 수 있습니다.코드설명%s문자열(string)%c문자 1개(character)%d정수(integer)%f부동소수(floating-point)%o8진수%x16진수%%Literal %(문자 % 자체) ✨ 정렬과 공백"%10s"는 전체 길이가 10개인 문자열 공간에서 대입되는 값을 오른쪽으로 정렬하고 그 앞의 나머지는 공백으로 남기라는 의미로 사용됩니다. 반대로 왼쪽 정렬은 "%-10s..
오늘은 Numpy 라이브러리의 주요 연산 및 함수들, Seaborn 라이브러리로 데이터를 다양하게 시각화하는 방법들을 배우고 Pandas 라이브러리와 통합하여 실습을 진행했습니다. 🤯 NumpyNumpy(Numerical Python)는 다차원 배열 객체를 지원하는 파이썬의 핵심적인 라이브러리입니다.또한, 대용량의 배열과 행렬 연산(이미지, 영상 분석)을 수행할 때 주로 사용되는 라이브러리입니다. ✨ ndarray 특징 및 속성💡 ndarray의 특징Python의 기본 리스트보다 빠르고, 메모리를 효율적으로 사용하며, 벡터 연산이 가능한 데이터 구조입니다.ndarray 객체는 동일한 자료형의 항목들만 저장이 가능합니다.💡 ndarray의 기본 속성ndarray 객체는 기본적으로 다음과 같은 속성들을..
오늘은 어제에 이어 Matplotlib 라이브러리를 가지고 여러 유형의 차트를 그려보며, 주어진 데이터를 시각화해보는 작업을 거쳤습니다. 📈 matplotlib.pyplotmatplotlib, 그 중에서도 pyplot 라이브러리는 파이썬에서 데이터를 시각화할 때 사용하는 대표적인 라이브러리입니다.특히 MATLAB 스타일의 인터페이스를 제공하며, 간단한 코드로 그래프를 쉽게 만들 수 있습니다.앞으로 이 matplotlib.pyplot을 간단히 plt로 줄여 설명드리겠습니다. ✨ plt의 특징plt는 다양한 그래프(선 그래프, 막대 그래프, 산점도 그래프 등)을 지원해줍니다.또한, 커스텀 함수들이 정말 다양하기 때문에 손쉽게 차트의 변형이 가능합니다.또 생성한 차트를 그래프로 출력하거나 이미지로 저장하는 ..
오늘은 Pandas 라이브러리에 대한 전반적인 이론을 배운 뒤, 주요 함수 및 Pandas에서 제공하는 Series, DataFrame을 가지고 여러 실습을 진행했습니다. 🐼 PandasPandas는 파이썬에서 가장 주로 사용되는 외부 라이브러리입니다.해당 라이브러리는 1차원 데이터를 다루는 데 효과적인 Series와, 행과 열로 구성된 2차원 데이터인 DataFrame을 제공합니다. ✨ Pandas의 특징빠르고 효율적인 표현이 가능하고, 실세계 데이터 표현에 용이합니다.다양한 형태의 데이터(시계열 / 레이블을 가진 데이터, 다양한 관측 데이터 등)들을 표현 가능합니다.Series는 1차원, DataFrame은 2차원(행렬) 데이터에 특화되어 있습니다.결측 데이터 처리, 데이터 추가 및 삭제, 데이터 ..
오늘은 함수, 모듈, 클래스에 대한 이론을 배우고, 해당 내용을 토대로 Spyder에서의 실습을 진행했습니다. 🥱 함수우리가 함수를 만들어야 하는 이유는 총 3가지가 있습니다!첫 번째는 중복 코드 방지두 번째는 코드의 유지 보수마지막으로 개발의 생산성간단히만 얘기해 별로 중요하지 않게 보일 수도 있겠지만, 이는 프로그램 설계, 모델 설계, 서비스 구현 등에 있어서 굉장히 중요한 부분을 차지하고 있기 때문에 함수를 설계할 때에는 심도 있게 고민하셔야 합니다.함수는 반드시 독립적으로 한 가지의 일만 수행할 수 있도록 설계되어야 합니다.함수를 정의하려면 def 키워드를 사용해야 하고, 그 키워드 다음에 함수의 기능과 연관된 적당한 함수명이 지정되어야 합니다. 함수 내부의 변수들은 함수가 호출되었을 때는 사용..
오늘부터 2주 정도는 본격적으로 파이썬 프로그래밍의 기초 지식들, 그리고 관련하여 데이터 분석 실습을 진행할 예정입니다.오늘은 그 중에서도 기본적인 파이썬 실습을 Spyder 환경에서 진행했습니다. 🐍 Python 프로그래밍🕸️ Spyder저희 수업에서는 이제 Spyder를 사용하여 파이썬 실습을 할 예정입니다.그 이유는 Jupyter나 Colab 환경의 경우에는 추후 Django나 Flask와 같은 파이썬 웹 프레임워크와 연동하게 되면, 문제가 발생하는 경우가 생기기 때문입니다."""Created on Mon Feb 3 09:10:48 2025 - 언제 만들었고@author: author name - 누가 만들었고,population data analysis - 어떤 파일인지"""파이썬 파일을 생..
이번 긴 설 연휴를 보내며 ADsP 자격증을 준비하기 위해 작성하게 된 글입니다.책이나 기출 변형 문제들을 다뤄보며 작성된 글이기에 미흡한 점이나 오타가 생긴 부분들은 댓글로 지적해주시면 감사하겠습니다. 🙇🏻♂️제가 본 기출에 나왔던 개념이나 언급되었던 표현들은 색을 다르게 하이라이트하였으니 참고 부탁드립니다.그럼 먼저, 1과목인 '데이터 이해' 파트부터 작성해 보겠습니다! 🤔 데이터 이해✨ 데이터와 정보데이터는 객관적인 사실(Fact)이라는 측면에서 존재적 특성을 가지고, 추론, 예측, 전망, 추정을 위한 근거(Basis)라는 측면에서는 당위적 특성을 가집니다.데이터는 언어나 문자 형태로 이루어져있는 정성적 데이터와 수치, 도형, 기호 등의 형태로 정형화된 정량적 데이터로 나뉩니다. 💡 지식 ..