๐๐ปโโ๏ธProfile โโ
"์๋
ํ์ธ์! ํ์ ์ผ๋ง์ ํ์ ์๋
์ผ๋ก ์ด๊ณ ์ถ์ ์ด์ค๋ฏผ์
๋๋ค."
- ์ธ์์ ์ดํดํ๊ณ ์ด๋ก์ด ๊ฒ์ ๋ฐ๋ช
ํ๊ธฐ ์ํด ๊ฐ๋ฐ์ ์ ํ๊ฒ ๋์๊ณ ,
์ง๊ธ์ ๋์ฑ ๋์ ์ ํ์ ๋๋ ๋ฐ์ดํฐ์ ํน ๋น ์ ธ ์์ต๋๋ค.
- ์ต๊ด์ ํ์ ๊นจ๋ฌ์๊ธฐ ๋๋ฌธ์ โ1์ผ 1์ปค๋ฐโ ์ด๋์ ํ๋ฉฐ,
๊ธฐ์ ๋ธ๋ก๊ทธ๋ฅผ ์ด์ํ์ฌ ์์ ๋ฟ ์๋๋ผ ํ์ธ์ ์ฑ์ฅ๋ ๋๋ชจํ๊ณ ์์ต๋๋ค.
- ์ํ๋ ์ง์์ ์ต๋ํ ๋ ์ ๋ ํฌ๊ธฐํ์ง ์๊ณ ๋จ๊ธฐ๊ฐ์ ์ต๋ํ๋
๋ฅ๋์ ์ธ ์์ธ์ ๋ชฐ์
๋ฅ๋ ฅ์ผ๋ก ๋๋ ๋ญ์ณ์ง ์ฌ๋์
๋๋ค.
- ๋ฌธ์ ๋ฅผ ์ ์ํ์ฌ, ๊ฐ์ค์ ์ธ์ฐ๊ณ ๋ฐ์ดํฐ ์์ง ๋ฐ ์ ์ฒ๋ฆฌ๋ถํฐ ๋ชจ๋ธ๋ง ๋ฐ ๋ชจ๋ธ ์ฑ๋ฅ ์ต์ ํ, ํ๋ก๋ํธ ๊ฐ๋ฐ ๋ฐ ๋ฐฐํฌ๊น์ง ์งํํ๋ ๊ฒ์ ์ฆ๊น๋๋ค.
****์ค์ ๊ณ ๊ฐ์ด ํ์ฉํ ์ ์๋ ์ ์ฉํ ํ๋ก๋ํธ**๋ฅผ ๋ง๋๋ ๊ฒ์ด ๋ชฉํ์
๋๋ค.
Contact & Channel
๐ Skills โโ
[ ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค ]
- Python
- ์๋ฃ๊ตฌ์กฐ์ ์๊ณ ๋ฆฌ์ฆ, OOP๋ฅผ ์ดํดํ๊ณ ์์ผ๋ฉฐ, ํด๋น ๊ฐ๋
์ ๋ฐ๋ฅธ ์ฝ๋ ์์ฑ ๊ฐ๋ฅ
- Pandas๋ฅผ ์ด์ฉํ์ฌ ๋ฐ์ดํฐ๋ฅผ ๋ฅ์ํ ๋ค๋ฃจ๋ฉฐ,
์๊ฐํ ๊ด๋ จ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ํตํด ๋ถ์ ๊ฒฐ๊ณผ ์๊ฐํ ๊ฐ๋ฅ
- Scikit-Learn์ ํตํ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ๋ง๊ณผ ํ์ดํ๋ผ์ธ ๊ตฌ์ถ ๊ฐ๋ฅ
- TensorFlow์ Keras๋ฅผ ํตํ ๋ฅ๋ฌ๋ ๋ชจ๋ธ๋ง ๊ฐ๋ฅ
- SQL: RDBMS๋ฅผ ์ดํดํ๋ฉฐ, ์ค์ฒฉ ์๋ธ ์ฟผ๋ฆฌ์ Join,
Window Function์ ์ด์ฉํ ๋ฐ์ดํฐ ์ถ์ถ ๋ฐ ๋ถ์ ๊ฐ๋ฅ
- Tableau: ๋น์ฆ๋์ค์ ๋ง์ถฐ ๋ฐ์ดํฐ ์๊ฐํ ๊ฐ๋ฅ
[ ๋ฐ์ดํฐ ์์ง๋์ด๋ง ]
- Apache Spark, Airflow
- Spark๋ฅผ ํตํ ๋์ฉ๋ ๋ฐ์ดํฐ ๋ถ์ฐ ์ฒ๋ฆฌ ๋ฐ Spark SQL์ ํ์ฉํ ๋ถ์ ๋ฐ ์ ์ฒ๋ฆฌ,
MLlib์ ํ์ฉํ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ๋ง ๊ฐ๋ฅ
- Airflow๋ก Spark job ์ค์ผ์คํธ๋ ์ด์
๊ฐ๋ฅ
- AWS - EC2, S3, RDS, EMR, Athena, Glue, Lambda
- ํด๋ผ์ฐ๋ ํ๊ฒฝ์์ ETL & ELT ํ๋ก์ธ์ค์ ๋ฐ์ดํฐ ํ์ดํ๋ผ์ธ ๊ตฌ์ถ ๊ฐ๋ฅ
- RDS๋ฅผ ํตํ MySQL, PostgreSQL ํน์ NoSQL(DynamoDB) ํธ๋ค๋ง ๊ฐ๋ฅ
- EC2 ์๋ฒ์์์ ๋ฐ์ดํฐ ์์ง ์๋ํ ๊ตฌํ ๊ฐ๋ฅ
- EMR์ ํตํ Apache Zeppelin ์ ์ ๋ฐ Spark ์ฌ์ฉ ๊ฐ๋ฅ
- Athena ์ด์ฉ S3 ๋ฐ์ดํฐ ์์
๋ฐ Glue ํฌ๋กค๋ฌ ์ด์ฉ ์คํค๋ง ๊ด๋ฆฌ ๊ฐ๋ฅ
- Lambda serverless computing ํธ๋ค๋ง ๊ฐ๋ฅ
- Docker: ๋์ปค ํ๊ฒฝ์์์ ๊ฐ๋ฐ ๊ฐ๋ฅ
- Selenium, Beautifulsoup4: requestes ํจํค์ง๋ฅผ ์ด์ฉํ ์ปค์คํ
ํฌ๋กค๋ฌ ์ ์ ๊ฐ๋ฅ
[ ํ๋ก ํธ & ๋ฐฑ์๋ ]
- Flask: ์น ๊ฐ๋ฐ CRUD์ ๋ํ ์ดํด๊ฐ ์์ผ๋ฉฐ, ์น ํ๋ ์์ํฌ ์ด์ฉ ์ ํ๋ฆฌ์ผ์ด์
์ ์ ๊ฐ๋ฅ
- HTML, CSS, JavaScript: ์น ์ฌ์ดํธ ์ปค์คํ
๋ฑ ํ์ ์ ์์ ๋กญ๊ฒ ์ฌ์ฉ ๊ฐ๋ฅ
[ ๊ธฐํ ]
- Git: ํ์
์ ์ํ ๋ธ๋์น ์์ฑ, ๋จธ์ง, ์์ ๋ด์ฉ ์ถฉ๋ ์ ๋๋๋ฆฌ๊ฑฐ๋
์์ ํ ๋จธ์ง, ํ๋ฆฌํ์คํธ ์งํ ๊ฐ๋ฅ
๐จ๐ปโ๐ Education โโ
์ฝ๋ ์คํ
์ด์ธ
AI ๋ถํธ์บ ํ(5๊ธฐ)
-
-
๐ย ์ปค๋ฆฌํ๋ผ
- Python์ Pandas ๋ฌธ๋ฒ์ ์ด์ฉํ ๋ฐ์ดํฐ EDA, Feature Engineering
- ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค๋ฅผ ์ํ ํต๊ณ์ ์ ํ๋์์ ๋ํ ํ์ต
- ๋จธ์ ๋ฌ๋ ์ด๋ก ๋ฐ Scikit-Learn ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ํ์ฉํ ๋ชจ๋ธ ๊ตฌํ
- ๋ฅ๋ฌ๋ ์ด๋ก ๋ฐ Keras, TensorFlow๋ฅผ ํ์ฉํ ๋ฅ๋ฌ๋ ๋ชจ๋ธ ๊ตฌํ
- ํ๋ก์ ํธ๋ฅผ ํตํ ๋ฐ์ดํฐ ๋ถ์ ๋ฐ ์ ์ฒ๋ฆฌ,์๋น์ค ์ ๊ณต์ ์ํ ๋ชจ๋ธ๋ง ๋ฐ ์ฑ๋ฅ ํฅ์
- Git, SQL, API, ํฌ๋กค๋ง, Flask, Docker ๋ฑ ๋ฐ์ดํฐ ์์ง๋์ด๋ง ๋ด์ฉ ํ์ต
- ํ๋ก์ ํธ๋ฅผ ํตํ ๋ฐ์ดํฐ ์ํคํ
์ณ ์ค๊ณ ๋ฐ ํ์ดํ๋ผ์ธ ๊ฐ๋ฐ๊ณผ ๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค ๊ตฌ์ถ
- Python์์์ ๋ฐ์ดํฐ ์๋ฃ ๊ตฌ์กฐ ๋ฐ ์๊ณ ๋ฆฌ์ฆ ํ์ต
- 60๋ช
์ ๋๊ธฐ์ ํจ๊ป ์ฑ์ฅํ๋ฉฐ ์ปค๋ฎค๋์ผ์ด์
์ญ๋ ๊ฐํ
ํจ์คํธ ์บ ํผ์ค
2021.10. - 2022. 1.
์ค์๊ฐ ๋น
๋ฐ์ดํฐ ์ฒ๋ฆฌ๋ฅผ ์ํ Spark & Flink ๐ย ์ปค๋ฆฌํ๋ผ
- ๋์ฉ๋ ๋ฐ์ดํฐ์์์ ์ํคํ
์ณ ์ค๊ณ ๋ฐ ํ์ดํ๋ผ์ธ ๊ฐ๋ฐ
- Apache Spark๋ฅผ ํตํ ๋์ฉ๋ ๋ฐ์ดํฐ ๋ณ๋ ฌ-๋ถ์ฐ ์ฒ๋ฆฌ
- Apache Airflow๋ฅผ ํตํ ๋ฐ์ดํฐ ์ค์ผ์คํธ๋ ์ด์
- Apache Flink & Kafk๋ฅผ ํตํ ๋ฐ์ดํฐ ์คํธ๋ฆฌ๋ฐ
- ์ฐ๋ฒ ๋ชจ๋น๋ฆฌํฐ ๋ฐ์ดํฐ๋ก ์ค์๊ฐ ๋น
๋ฐ์ดํฐ ์ฒ๋ฆฌ
๋ฐ์ดํฐ ์์ง๋์ด๋ง ์ฌ์ธ์ ํจํค์ง ๐ย ์ปค๋ฆฌํ๋ผ
- ํด๋ผ์ฐ๋ ์ธํ๋ผ์ธ AWS๋ฅผ ๋ค์ํ๊ฒ ํ์ฉ
- API๋ก ๋งค์ผ ์์ฑ๋๋ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌ
- ๋ฐ์ดํฐ ์์ง๋์ด๋ง๋ฟ ์๋๋ผ ์ถ์ฒ ์์คํ
์ ๊ธฐ๋ฐํ ์ฑ๋ด ์๋น์ค ๊ตฌํ
๐ง๐ปโโ๏ธ Personal Experience & Projects โโ
Kaggle
6mini | Contributor
SIXAT
- ํ์ค ์๊ฐ: ๋์ฉ๋ ๋ชจ๋น๋ฆฌํฐ ๋ฐ์ดํฐ์ ์ํคํ
์ณ ์ค๊ณ์ ๋ถ์ฐ ์ฒ๋ฆฌ ํ์ดํ๋ผ์ธ ๊ตฌ์ถ ๋ฐ ์ค์๊ฐ ์ฒ๋ฆฌ ํ๋ก์ ํธ