본문 바로가기
반응형

Dacon7

[Dacon] 부동한 허위매물 분류 해커톤 (3) - 최종 코드 부동산 허위매물 분류 해커톤 - 최종 코드  안녕하세요! 이번에는 EDA 과정 이후의 대회에서 최종 제출한 코드를 살펴보도록 하겠습니다. 이번 최종 코드 과정에서는 지난 EDA를 통해 어떻게 성능을 올릴지 그래프와 수치를 보면서 전략을 세웠다면 이번 시간에는 최종 코드를 통해서는 여러 전략의 시도 끝에 대회에 최종적으로 어떤 전략들을 세웠는 지를 설명하도록 하겠습니다. 전반적인 과정을 아래와 같습니다.  * 최종 코드 주요 내용1. 결측치 처리2. 파생 변수 생성3. 정규화 시도 4. 데이터 변형5. Feature Drop6. StandardScaler7. LGBM8. Feature Importance 데이콘 링크 : https://dacon.io/ 데이터사이언티스트 AI 컴피티션10만 AI 팀이 협업하.. 2025. 2. 28.
[Dacon] 부동산 허위매물 분류 해커톤 (2) - EDA 부동산 허위매물 분류 해커톤 (2) - EDA  이번 글은 Dacon 부동산 허위매물 분류 해커톤에서 제공받은 데이터를 기반으로 수행한 EDA에 대한 글입니다. 사용된 데이터는 부동산 매물관련 정보가 포함된 정보였고 이를 활용하여 허위매물을 분류하는 AI 알고리즘을 개발하는 것이 대회의 주제였습니다. 제공 받은 데이터의 컬럼은 ID, 매물확인방식, 보증금, 월세, 전용면적, 해당층, 총층, 방향, 방수, 욕실수, 주차가능여부, 총주차대수, 관리, 중개사무소, 제공플랫폼, 게재일 그리고 정답인 허위매물여부였습니다. 일단 지난 전기차 예측은 회귀의 문제였다면 이번에는 분류의 문제로서 0과 1만을 구분하는 Binary 방식입니다.  먼저, 데이터 분석 이전에 부동산 시장은 우리의 삶의 필수 요소인 의, 식, .. 2025. 2. 28.
[Dacon] 부동산 허위매물 분류 해커톤 (1) - 후기 (Private 43, 상위 10%) Dacon - 부동산 허위매물 분류 해커톤  안녕하세요. 이번 글은 Dacon에서 주관한 '부동산 허위매물 분류 해커톤 : 가짜를 색출하라!'에 대한 참가 및 후기 글입니다. 지난 번에는 데이콘에서 전기차 가격 예측 해커톤에 참가를 했었습니다. 지난 대회는 최종 3위로 얼떨결에 높은 순위를 기록할 수 있었습니다. 이러한 경험을 발판 삼아서 이번 대회에도 큰 열정을 가지고 바로 도전을 했지만, 처음에는 모든 방법을 다 써보아도 오르지 않는 점수 때문에 머리가 아팠지만, 계속된 분석 끝에 결과를 계속 제출한 결과, 다행히 이번 대회에도 상위권에 머무를 수 있었습니다. 하루가 다르게 순위가 변하는 치열한 과정 속에서 그래도 나름 잘 살아남았던 것 같습니다.    주제 : 부동산 허위매물 분류 AI 알고리즘 개.. 2025. 2. 28.
[Dacon] 전기차 가격 예측 해커톤 (3) - Prediction Process 전기차 가격 예측 해커톤 - Prediction Process  안녕하세요! 이번에는 지난 EDA에 이어서 데이터를 불러오는 것부터 예측까지의 모든 과정에 대한 글입니다. 지난 번 EDA에서 데이터의 이상치를 제거했다면 이번 글을 통해서는 Null 값을 어떻게 처리했는지, 어떤 Scaler를 사용했고 어떤 컬럼을 Drop했으며, 마지막으로 학습을 위해 어떤 모델을 사용했는 지에 대해 알아보도록 하겠습니다. 전반적인 과정을 요약하면 아래와 같습니다.  보증기간(년), 제조사, 모델, 구동방식에 따른 평균Scaler 선택학습 모델 선택데이콘 링크 : https://dacon.io/ 데이터사이언티스트 AI 컴피티션10만 AI 팀이 협업하는 데이터 사이언스 플랫폼. AI 경진대회와 대상 맞춤 온/오프라인 교육,.. 2025. 1. 31.
[Dacon] 전기차 가격 예측 해커톤 (2) - EDA 전기차 가격 예측 해커톤 - Exploratory Data Analysis, EDA  안녕하세요. 이번에는 Dacon 전기차 가격 예측 해커톤에서 제공받은 데이터를 기반으로 수행한 탐색적 데이터 분석(Exploratory Data Anaysis, EDA)에 대한 글입니다. 해당 데이터는 전기차와 관련된 데이터를 활용하여 전기차 가격을 예측하는 AI 알고리즘 개발을 위해 제공되었으며, 데이터의 컬럼은 ID, 제조사, 모델, 차량상태, 배터리용량, 주행거리(km), 구동방식, 보증기간(년), 사고이력, 연식(년) 그리고 정답인 가격(백만원)으로 이루어진 데이터입니다. 해당 데이터 기반의 예측은 전기차 시장에서 소비자와 제조사 모두에게 중요한 가치를 제공하게 되는 데, 정확한 가격 예측은 시장 경쟁력 분서그 .. 2025. 1. 31.
[Dacon] 전기차 가격 예측 해커톤 (1) - 후기 (최종 3위) Dacon - 전기차 가격 예측 해커톤  안녕하세요. 이번 글은 Dacon에서 주관한 '전기차 가격 예측 해커톤 : 데이터로 EV를 읽다!' 에 대한 참가 및 후기 글입니다. 2025년의 시작으로 Dacon 대회를 5개 정도 참가해서 우수한 성적을 거두어보자. 라는 목표를 세웠는 데, 오늘 그 첫 번째 대회가 종료되었고 총 참가자 1,259명 중 5위 라는 기록을 할 수 있었습니다. Dacon 대회는 2021년 이후로 거의 참가를 못하고 있었는 데, SKT FLY AI 이후로 누군가와 오랜만에 경쟁을 하면서 순위가 훅훅 바뀌는 쫄깃한 경험을 할 수 있었습니다. 이에 대해서 제가 어떻게 데이터를 분석하고 결과를 내는 과정을 공유하고자 이번 글을 작성하게 되었습니다. 아직 최종 수상자 발표까지는 나오지 않았.. 2025. 1. 31.
[Dacon]인공지능 경진대회 플랫폼, Dacon 다양한 데이터를 접하면서 인공지능 경진대회에 참여하고 싶다면? 데이터 분석과 머신러닝에 대한 직군을 진로로 생각했다면, 가장 중요한 것은 얼마나 다양한 데이터를 접해보았는가? 혹은 그 데이터들을 어떤 방식으로 처리해보았는 가에 대한 경험이 중요하다고 생각합니다. 인터넷에서 접할 수 있는 공공 데이터 포털, AI Hub 등과 같이 데이터를 제공하는 플랫폼도 있지만 해당 데이터를 어떻게 처리할지 그리고 어떤 방식으로 데이터를 처리해야될지 모를 때, 그리고 다른 사람들은 어떤 방식으로 데이터를 처리하는 지 알고 싶을 때는 참여할 수 있는 인공지능 경진대회 플랫폼이 있습니다. 제가 경험했던 인공지능 경진대회 플랫폼은 아래와 같이 3가지가 있습니다. 1. Kaggle 링크 : https://www.kaggle.c.. 2023. 10. 31.
반응형