탑승객 예측

탑승객 예측
운송 수단 이용을 예측하는 알고리즘

프로젝트 목표     DOWNLOAD CASE STUDY

공항 이용객이 매년 증가함에 따라 체크인할 때나 보안 검색대와 같은 곳에서 승객을 처리하는 데 많은 어려움이 있습니다. 승객들의 불만은 대부분 공항에서 승객과 수하물을 처리하는 문제로 인한 것입니다. 특히 체크인 지연, 좌석 할당 문제, 수하물 분실, 목적지까지의 배송 지연이 발생하거나, 결항, 파업, 날씨와 같은 정보를 제대로 받지 못하거나 비정상적인 상황이 발생했을 때 처리가 미흡하기 때문입니다.

 

탑승수속이나 보안심사 지연으로 인한 소비자 불만을 줄이기 위해서는 보안요원의 수요에 대한 계획을 사전에 수립해야 합니다. 목표는 긴 줄을 서지 않고 가장 빠르게 승객을 처리할 수 있도록 충분한 직원을 확보하는 것이지만, 이와 동시에 직원을 최대한 활용해야 합니다. 따라서 공항 직원에게 필요한 모든 정보를 자동으로 제공하는 지능형 승객 예측 시스템이 필요합니다.

몇 주 내지 몇 달 정도 범위의 승객 수를 예측하는 것이 인사 관리 계획에서 가장 중요합니다. 이는 모든 노선과 항공사를 포함한 공항 전체에 대한 수요 예측이 필요하다는 것을 의미합니다.

 

이 프로젝트의 일환으로, Knowtion은 모든 공항 정보와 과거의 데이터를 사용하여 향후 수 개월 동안 각 항공편의 승객 수를 예측하는 최첨단 알고리즘을 개발했습니다. 이를 이용해 미래의 각 기간별로 공항을 이용하는 예상 승객 수를 계산했습니다.

개발 접근방향

데이터 처리의 관점에서 보면 개별 항공편의 승객 수를 정확하고 효율적으로 예측할 수 있는 시스템을 구축하기 위해서는 몇 가지 해결해야할 과제가 있습니다. 알고리즘 파이프라인은 많은 불확실성과 파업, 기상 조건, 휴일, 여행 경로와 일정 변경 등 수많은 특수한 이벤트를 고려해야 합니다. 이러한 모든 요소와 종속성을 고려하면 각 항공편에 대한 대규모 특징 벡터가 생성됩니다. 알고리즘 파이프라인은 정확한 예측과 관련된 요소를 자동으로 찾아야 합니다. 예를 들어 랜덤 포레스트나 신경망과 같은 기계 학습을 위한 최신 데이터 기반 모델과 알고리즘이 사용됩니다.

대규모 특징 벡터와 많은 항공편을 고려해야 하기 때문에 방대한 데이터 세트를 처리해야 합니다. 많은 양의 데이터를 효율적으로 처리하기 위해 최신의 빅 데이터 기술이 사용되었습니다. 예를 들어, 여러 분산 클러스터 노드에서 모든 항공편을 병렬로 처리하기 위해 Spark와 같은 분산 처리 프레임워크에서 알고리즘 파이프라인을 구현했으며, 이를 통해 모든 항공편의 승객 예측을 효율적으로 처리할 수 있습니다.

결과 및 이점

승객 수의 자동 예측

몇 주 내지 몇 개월간의 예측 범위

체크인이나 보안 검색에 필요한 공항 직원의 인력계획을 더 정확하게 수립하는데 활용

랜덤 포레스트와 신경망 등 기계학습을 위한 최신 데이터 기반 모델 및 알고리즘

예측 모델의 분산처리 및 효율적인 처리를 위한 최신 빅 데이터 기술


추가 정보가 필요하십니까?
문의