본문 바로가기
반응형

EDA4

[Dacon] 악성 URL 분류 AI 경진대회 (2) - EDA 악성 URL 분류 AI 경진대회 - EDA  이번글은 악성 URL 분류 대회에서 수행했던 탐색적 데이터 분석(EDA)에 대한 글입니다. 이번 대회를 통해서 URL에 대해서 알아보며, 기본적으로 URL을 분류하기 위해 URL의 구성 그리고 URL 데이로부터 어떤 전처리 방법을 사용하는 지에 대해서 Kaggle, 논문을 통해서 여러 가지 방법들을 알 수 있었던 시간이었습니다. 그럼 오늘 EDA 과정을 살펴보도록 하겠습니다.  내용 요약1. 데이터 확인- URL 구조2. 데이터 추출 기법3. 기타 기법  Dacon 악성 URL 분류 AI 경진대회 링크 : https://dacon.io/competitions/official/236451/overview/description 악성 URL 분류 AI 경진대회 - .. 2025. 3. 31.
[Dacon] 채무 불이행 여부 예측 해커톤 (2) - EDA 채무 불이행 여부 예측 해커톤 - EDA  이번 글은 채무 불이행 여부 예측 해커톤에서 수행했던 탐색적 데이터 분석(EDA)에 대한 글입니다. 대회를 수행하면서 EDA는 데이터는 어떤 데이터이며, 컬럼은 무엇이고 성능을 끌어올리기 위해 어떤 것들을 해야될지 고민하고 분석하는 과정이라고 할 수 있을 것 같습니다.  그럼 제가 대회를 통해서 어떤 것을 고민했는 지 살펴보도록 하겠습니다.  내용 요약1. 데이터 확인2. 데이터 정보 확인- 정보- 결측치3. 그래프 & 이상치- 기본 그래프 확인- 기준에 따른 그래프 확인- '왜도' 보정- 상관 그래프 확인4. 컬럼 Drop5. 파생 변수 추출하기  Dacon 채무 불이행 여부 대회 링크: https://dacon.io/competitions/official/2.. 2025. 3. 31.
[Dacon] 부동산 허위매물 분류 해커톤 (2) - EDA 부동산 허위매물 분류 해커톤 (2) - EDA  이번 글은 Dacon 부동산 허위매물 분류 해커톤에서 제공받은 데이터를 기반으로 수행한 EDA에 대한 글입니다. 사용된 데이터는 부동산 매물관련 정보가 포함된 정보였고 이를 활용하여 허위매물을 분류하는 AI 알고리즘을 개발하는 것이 대회의 주제였습니다. 제공 받은 데이터의 컬럼은 ID, 매물확인방식, 보증금, 월세, 전용면적, 해당층, 총층, 방향, 방수, 욕실수, 주차가능여부, 총주차대수, 관리, 중개사무소, 제공플랫폼, 게재일 그리고 정답인 허위매물여부였습니다. 일단 지난 전기차 예측은 회귀의 문제였다면 이번에는 분류의 문제로서 0과 1만을 구분하는 Binary 방식입니다.  먼저, 데이터 분석 이전에 부동산 시장은 우리의 삶의 필수 요소인 의, 식, .. 2025. 2. 28.
[Dacon] 전기차 가격 예측 해커톤 (2) - EDA 전기차 가격 예측 해커톤 - Exploratory Data Analysis, EDA  안녕하세요. 이번에는 Dacon 전기차 가격 예측 해커톤에서 제공받은 데이터를 기반으로 수행한 탐색적 데이터 분석(Exploratory Data Anaysis, EDA)에 대한 글입니다. 해당 데이터는 전기차와 관련된 데이터를 활용하여 전기차 가격을 예측하는 AI 알고리즘 개발을 위해 제공되었으며, 데이터의 컬럼은 ID, 제조사, 모델, 차량상태, 배터리용량, 주행거리(km), 구동방식, 보증기간(년), 사고이력, 연식(년) 그리고 정답인 가격(백만원)으로 이루어진 데이터입니다. 해당 데이터 기반의 예측은 전기차 시장에서 소비자와 제조사 모두에게 중요한 가치를 제공하게 되는 데, 정확한 가격 예측은 시장 경쟁력 분서그 .. 2025. 1. 31.
반응형