- 데이터는 Kaggle에 올라와있는 데이터 사용
- 실제/정규데이터가 아닌만큼 결과해석에 유의
- 사용 라이브러리: Pandas, Scikit-Learn
- 최종 업데이트 일자: 2025년 7월 01일

1. 개요
최근 항공사들은 기내 서비스 개선을 통해 고객 만족도를 높이고, 재이용률을 끌어올리기 위해 다양한 노력을 기울이고 있습니다. 특히, 비행 만족도는 항공사에 대한 평가와 서비스 품질을 이해하는 데 중요한 지표로 사용되고 있습니다. 이번 포스팅에서는 Kaggle에서 제공한 Airline Passenger Satisfaction 데이터를 활용하여, 어떤 요소가 항공사 만족도에 가장 큰 영향을 주는지를 분석한 결과를 공유합니다. 이를 통해 A 항공사는 서비스 개선 및 운영 전략 수립에 활용할 수 있을 것이며 비행 만족도에 대한 인사이트를 제공하여 고객 경험을 개선하고 경쟁 우위를 확보하는 데 도움을 줄 것 이라고 생각됩니다.
데이터 링크: https://www.kaggle.com/datasets/teejmahal20/airline-passenger-satisfaction
2. 데이터 개요
- 데이터 수: 약 200,000건
- 항공사: 익명처리된 A 항공사
- 주요 변수: 고객 성별, 나이, 고객 유형(Loyal/Disloyal), 비행 거리, 좌석 등급, 여행 목적, 기내 Wi-Fi, 음식/음료, 온라인 체크인, 청결도 등 총 20개 이상의 만족도 항목
- 종속 변수: Satisfaction (만족 or 불만족)
3. 기술통계 요약
| 항목(Eng) | 항목(Kor) | 만족도 평균 (5점 척도) |
비즈니스 | 이코노미 | 이코노미+ |
| Inflight Wi-Fi Service | 기내 와이파이 서비스 | 2.72 | 2.76 | 2.68 | 2.77 |
| Department/Arrival time Convenient | 출/도착시간 편리성 | 3.06 | 2.91 | 3.20 | 3.22 |
| Ease of Online Booking | 온라인 예약의 편리성 | 2.75 | 2.91 | 2.61 | 2.66 |
| Gate Location | 게이트 위치 | 2.97 | 2.98 | 2.97 | 2.96 |
| Food & Drink | 식음료서비스 | 3.20 | 3.32 | 3.09 | 3.12 |
| Online Boarding | 온라인 탑승 절차 | 3.25 | 3.72 | 2.81 | 2.89 |
| Seat Comfort | 좌석 편의성 | 3.43 | 3.64 | 3.09 | 3.06 |
| Inflight Entertainment | 기내 엔터테인먼트 서비스 | 3.35 | 3.84 | 3.45 | 3.36 |
| On-Board Service | 기내 서비스 | 3.38 | 3.72 | 2.81 | 2.89 |
| Leg-Room Service | 좌석간격 | 3.35 | 3.32 | 3.09 | 3.12 |
| Baggage Handling | 수화물 처리 | 3.63 | 3.72 | 3.45 | 3.36 |
| Check-In Service | 체크인 서비스 | 3.30 | 3.52 | 3.12 | 3.01 |
| Inflight Service | 기내 서비스 | 3.64 | 3.84 | 3.46 | 3.39 |
| Cleanliness | 청결도 | 3.28 | 3.48 | 3.11 | 3.13 |
비즈니스 클래스 승객들은 이코노미나 이코노미 플러스 승객보다 더 높은 비용을 지불하는 만큼 전반적으로 더 높은 만족도를 보이는 경향이 있습니다. 그러나 세 그룹 모두 공통적으로 낮은 만족도를 보이는 항목은 Inflight Wi-Fi 서비스였습니다. 이는 기내에서 스마트기기가 인터넷에 접속할 수 있도록 지원하는 서비스로, 인터넷 속도의 느림, 접속 불안정성, 또는 가격 대비 성능이 낮다는 인식이 주된 원인으로 추정됩니다.
한편, 비즈니스 고객과 일반 고객 간의 가장 큰 만족도 차이를 보인 항목은 온라인 탑승 서비스였습니다. 해당 서비스는 모바일 앱이나 웹사이트를 통해 사전 체크인과 탑승권 발급이 가능한 시스템입니다. 비즈니스 승객의 경우 별도의 전용 체크인 카운터가 제공되기 때문에, 온라인 탑승 서비스를 이용하지 않아도 빠르게 탑승할 수 있는 환경이 조성되어 있어 사용률이 낮을 수 있습니다. 또한 비즈니스 고객은 비행 경험이 많아 관련 앱 설치 및 시스템 사용에 익숙할 가능성이 높아, 이 서비스에 대해 상대적으로 더 높은 만족도를 보일 수 있습니다.
기내 서비스(On-board Service), 기내 엔터테인먼트(Inflight Entertainment), 수하물 처리(Baggage Handling) 등 비행 그 자체와 밀접하게 연관된 핵심 서비스들은 대체로 높은 만족도를 유지하고 있음을 확인할 수 있었습니다. 이는 항공사의 기본 서비스 품질은 일정 수준 이상으로 잘 유지되고 있다는 점을 확인할 수 있습니다.
4. Logistic 회귀분석과 Random Forest 모델 분석
항공사 서비스 만족도에 영향을 미치는 요인을 보다 정교하게 파악하기 위해 머신러닝 기법을 적용해보았습니다. 그중에서도 로지스틱 회귀 분석(Logistic Regression)과 랜덤 포레스트(Random Forest) 모델을 활용하여 어떤 요소가 승객의 만족 여부에 큰 영향을 미치는지를 확인했습니다. 먼저 Logistic 회귀분석은 아래와 같은 코드를 통해 진행했습니다.
import pandas as pd
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error, r2_score, accuracy_score
from sklearn.preprocessing import StandardScaler
data=pd.read_excel(".xlsx")
features = ['Gender', 'Customer Type', 'Age', 'Type of Travel',
'Class', 'Flight Distance', 'Inflight wifi service',
'Departure/Arrival time convenient', 'Ease of Online booking',
'Gate location', 'Food and drink', 'Online boarding', 'Seat comfort',
'Inflight entertainment', 'On-board service', 'Leg room service',
'Baggage handling', 'checkin service', 'Inflight service',
'Cleanliness', 'Departure Delay in Minutes', 'Arrival Delay in Minutes']
data=data.dropna()
X=data[features]
y=data['satisfaction']
X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.3,random_state=42)
model=LogisticRegression()
model.fit(X_train, y_train)
y_prediction=model.predict(X_test)
mse=mean_squared_error(y_prediction, y_test)
r2=r2_score(y_prediction, y_test)
accuracy=accuracy_score(y_prediction, y_test)
print(mse)
print(r2)
print(accuracy)
coefficients=model.coef_
feature_names=X.columns
print("Coefficients:")
for feature, coef in zip(feature_names, coefficients[0]):
print(f"{feature}: {coef}")
print("Intercept:", model.intercept_)
mse 0.12512526285603013
R2 0.48397218742802806
Accuracy 0.87849737149869
Coefficients:
Gender: -0.0419257745423557
Customer Type: -2.042465774196437
Age: -0.112792781195577
Type of Travel: 3.035926832509709
Class: -0.328333582997295
Flight Distance: 0.0970912982312608
Inflight wifi service: 0.45610559516967275
Departure/Arrival time convenient: -0.19594720181356255
Ease of Online booking: -0.17979213758294728
Gate location: 0.04477418298805786
Food and drink: -0.0245573975262478
Online boarding: 0.8751211902063735
Seat comfort: 0.1058224988448676
Inflight entertainment: 0.08537576806808515
On-board service: 0.4147652233226424
Leg room service: 0.34402134333958195
Baggage handling: 0.1936583684762783
Checkin service: 0.43804215193380736
Inflight service: 0.16471297339728313
Cleanliness: 0.312947392824575
Departure Delay in Minutes: 0.18584640681198968
Arrival Delay in Minutes: -0.362779476252513
Intercept: [-1.920825]
먼저 로지스틱 회귀 분석 결과에 따르면, 온라인 탑승 서비스(Online Boarding)는 만족도를 크게 향상시키는 주요 요소로, 계수값이 0.875로 가장 높은 수치를 기록했습니다. 또한, 기내 Wi-Fi 서비스, 체크인 서비스, 다리 공간, 기내 청결도 역시 승객의 긍정적인 경험에 기여하는 변수로 나타났습니다.
반면에 도착 지연시간(Arrival Delay)은 만족도에 가장 강한 부정적 영향을 미치는 요소로, 계수값이 -0.362로 나타났습니다. 고객 유형(Customer Type)에서도 충성고객이 아닌 경우(disloyal)는 만족도가 현저히 낮은 것으로 나타나, 신규 고객의 충성도 향상이 필요하다는 시사점을 줍니다.
다음으로 랜덤 포레스트(Random Forest) 모델을 통해 만족도 예측 정확도를 분석한 결과, 모델 정확도는 무려 98%로 매우 우수한 성능을 보였습니다. 아래의 코드를 통해 결과를 구할 수 있었습니다.
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import mean_squared_error, accuracy_score, precision_score, recall_score
import pandas as pd
import matplotlib.pyplot as plt
model=RandomForestClassifier()
model.fit(X_train, y_train)
y_prediction=model.predict(X_test)
MSE=mean_squared_error(y_true=y_test, y_pred=y_prediction)
accuracy=accuracy_score(y_test, y_prediction)
precision=precision_score(y_test, y_prediction)
recall=recall_score(y_test, y_prediction)
print("MSE:", MSE)
print("Accuracy:", accuracy)
print("Precision:", precision)
print("Recall:", recall)
importances=model.feature_importances_
feature_importances=pd.DataFrame({'Feature': X.columns,'Importance': importances})
feature_importances.sort_values(by='Importance', ascending=False, inplace=True)
print(feature_importances)
plt.figure(figsize=(10, 6))
plt.barh(feature_importances['Feature'], feature_importances['Importance'])
plt.xlabel('Importance')
plt.ylabel('Feature')
plt.title('Feature Importances')
plt.show()
MSE: 0.0124
Accuracy: 0.9875
Recall: 0.97989
R2: 0.94942
이 분석에서 사용된 랜덤 포레스트(Random Forest) 모델은 다수의 의사결정나무를 활용하여 예측을 수행하는 앙상블 학습 기법으로, 단순히 분류 정확도가 높을 뿐만 아니라, 각 변수(피처)가 예측 결과에 얼마나 기여했는지를 수치화하여 도출할 수 있는 장점을 갖고 있습니다. 즉, 모델이 어떤 항목을 더 중요하게 인식했는지를 바탕으로, 결과에 영향을 미친 핵심 요인을 해석할 수 있다는 것입니다. 이러한 변수 중요도(feature importance) 분석은 단순한 기술적 지표를 넘어서, 비즈니스 전략 수립에 있어서 매우 실질적인 인사이트를 제공할 수 있습니다. 어떤 서비스 요소가 승객 만족도에 더 큰 영향을 주는지를 파악함으로써, 항공사는 제한된 자원과 예산을 효율적으로 배분하고, 가장 영향력 있는 영역에 집중 투자할 수 있게 됩니다.
- 온라인 탑승 서비스 (Online Boarding)
- 기내 Wi-Fi 품질 (Inflight Wi-Fi Service)
- 온라인 탑승 서비스 (Inflight Entertainment)
- 좌석편의성 (Seat Comfort)
- 좌석간격 (Leg Room Service)

이러한 결과를 종합해 보면, 고객 만족도를 높이기 위해서는 단순히 좌석의 안락함이나 음식의 질을 넘어서, 디지털 기반 서비스 경험(예: 온라인 체크인, 기내 인터넷 환경)의 품질이 핵심적인 영향을 준다는 점을 확인할 수 있습니다.
5. 분석을 바탕으로 한 제시 방안
1. Inflight Wi-Fi 서비스 및 가격모델 개선
기내 와이파이 서비스는 최근 항공사 서비스 만족도에 있어 핵심적인 요소로 떠오르고 있습니다. 실제 분석 결과에서도 와이파이 품질은 승객 만족도에 큰 영향을 미치는 변수 중 하나로 나타났습니다. 그러나 현실적으로 많은 항공사에서 제공하는 기내 와이파이는 속도가 느리거나 연결이 자주 끊기며, 가격 또한 부담스럽다는 이유로 고객들의 불만족 요인이 되고 있습니다.
이러한 문제를 해결하기 위해서는 항공사가 보다 안정적이고 고속의 기내 인터넷 환경을 구축할 수 있도록 중장기적인 관점에서 기술적 접근을 시도해야 합니다. 예를 들어, STARLINK와 같은 글로벌 위성 통신 네트워크와의 제휴, 또는 기내 통신 인프라의 기술 고도화를 통해 보다 일관된 연결성과 높은 품질을 확보할 수 있습니다. 일부 항공사는 이미 신형 기체 도입 시 이러한 통신 기술을 탑재하고 있으며, 이는 전체 비행 경험의 질을 향상시키는 주요 수단이 되고 있습니다.
또한 기술적 개선과 더불어, 요금 정책에 대한 재설계도 병행될 필요가 있습니다. 현재는 사용료가 높아 일부 고객에게만 제한적으로 제공되고 있지만, 앞으로는 텍스트 기반 서비스(예:카카오톡 메신저)는 무료, 동영상 시청은 시간제와 데이터 사용량을 결합한 복합 요금제 방식 등으로 보다 합리적이고 접근성 높은 구조를 구축하는 것이 바람직합니다. 이와 함께 탑승 클래스나 고객 등급에 따라 와이파이 사용 혜택을 차등 제공하는 방식도 고려할 수 있습니다.
무엇보다 중요한 점은, 승객들의 콘텐츠 소비 패턴이 기내 엔터테인먼트 시스템 중심에서 개인 디바이스 기반의 스트리밍 이용 중심으로 급속히 변화하고 있다는 사실입니다. 넷플릭스(Netflix), 유튜브(YouTube) 등 다양한 OTT 플랫폼을 이용해 자신만의 콘텐츠를 즐기는 승객들이 늘어남에 따라, 기내 와이파이의 품질은 단순한 편의성의 문제가 아니라 전체 비행 경험의 질을 좌우하는 핵심 서비스로 자리잡고 있습니다.
따라서 항공사는 기술적 투자와 요금 전략의 재정비를 통해 기내 와이파이 서비스를 강화함으로써, 고객 경험을 혁신하고 브랜드 충성도 및 재이용률을 높이는 전략적 기회를 확보할 수 있을 것입니다.
2. Economic Plus(프리미엄 이코노미) 서비스 개선

최근 많은 항공사들이 일반 이코노미 클래스와 비즈니스 클래스 사이에 위치한 프리미엄 이코노미 좌석을 운영하고 있습니다. 이는 비교적 합리적인 가격으로 더 나은 서비스를 경험하고자 하는 승객들을 겨냥한 상품입니다. 그러나 실제 분석 결과를 살펴보면, Economy Plus는 일반 이코노미에 비해 가격 차이에 비해 뚜렷한 만족도 차이를 보이지 않는 것으로 나타났습니다.
예를 들어, 도쿄 하네다공항과 뉴욕 JFK공항 간의 항공편을 기준으로 할 때, 기간과 일정에 따라 다르지만, 이코노미와 프리미엄 이코노미 간의 요금 차이는 약 160만 원에 달합니다. 하지만 고객 만족도 측면에서는 프리미엄 이코노미가 일반 이코노미와 유의미한 차이를 보이지 않았으며, 이는 많은 고객들이 지불한 추가 비용에 비해 얻는 서비스 혜택이 충분하지 않다고 느끼고 있음을 의미합니다. 이로 인해 프리미엄 이코노미 는 가격 대비 성능(가성비)에 대한 의문이 제기될 수밖에 없습니다.
이 문제를 해결하기 위해 항공사는 프리미엄 이코노미 상품의 실질적인 경쟁력을 강화할 필요가 있습니다. 먼저, 좌석 간격을 확대하여 탑승 중 신체적인 편안함을 높이고, 고급 식사와 음료를 제공하는 방식으로 서비스의 질을 높일 수 있습니다. 또한, 개인용 엔터테인먼트 시스템 제공, 우선 수하물 처리 서비스 도입 등을 통해, 프리미엄 이코노미 가 단순히 넓은 좌석에 그치지 않고, 비즈니스 클래스에 준하는 혜택을 일부 누릴 수 있는 등급으로 포지셔닝될 수 있도록 개선이 필요합니다.
반대로, 현재의 서비스 수준을 유지하면서도 가격을 낮춰 고객 기대에 부합하는 가격 정책으로 조정하는 것도 하나의 전략이 될 수 있습니다. 고객은 자신이 지불한 비용에 대해 합리적인 만족을 얻길 원하며, 서비스 수준과 가격 간의 균형이 맞춰질 때 상품에 대한 신뢰도와 재이용 의사 역시 높아지게 됩니다.
따라서 프리미엄 이코노미 클래스의 위치를 명확히 정의하고, 고객 기대에 부합하는 서비스 구성 또는 가격 정책을 정교하게 설계함으로써 해당 상품의 경쟁력을 실질적으로 강화할 필요가 있습니다. 이는 항공사에게 있어 고객 만족도 제고와 수익성 확보라는 두 가지 목표를 동시에 달성할 수 있는 중요한 전략적 지점이 될 것입니다.
3. 온라인 체크인(Online Boarding) 시스템 개선 및 현장 발권 유지
온라인 체크인(Online Boarding) 서비스는 최근 항공사 고객 경험의 핵심 요소 중 하나로 자리 잡고 있습니다. 실제 분석 결과에 따르면, 이 서비스는 승객 만족도에 매우 큰 영향을 미치는 변수로 확인되었으며, 특히 출장을 자주 다니는 고객층에게 있어 빠르고 간편한 체크인 과정은 전반적인 비행 경험의 질을 좌우하는 요소로 작용하고 있습니다.
하지만 현재 제공되는 온라인 체크인 시스템은 사용자 편의성 측면에서 아쉬운 점이 존재합니다. 이를 개선하기 위해서는 UI/UX를 보다 직관적이고 간단하게 설계하고, 서버 응답 속도 및 전체적인 프로세스를 최적화하여 고객이 최소한의 입력만으로 체크인을 완료할 수 있도록 지원할 필요가 있습니다. 이러한 디지털 경험의 개선은 고객의 편의성을 높이고 불필요한 대기 시간을 줄이는 데 큰 도움이 됩니다.
그럼에도 불구하고 모든 승객이 디지털 환경에 익숙한 것은 아닙니다. 특히 고령층 고객이나 온라인 서비스 이용에 제한이 있는 고객을 고려한다면, 온라인 서비스 개선뿐 아니라 현장 발권 창구의 유지 및 보완도 반드시 병행되어야 합니다. 이는 단순히 기술적 보완책에 그치지 않고, 고객과 직접 대면할 수 있는 중요한 'Touching Point'로 작용할 수 있습니다.
이러한 오프라인 접점은 항공사의 친근하고 따뜻한 이미지를 전달하는 데 기여할 수 있으며, 고객 만족도 제고는 물론 브랜드 신뢰도 향상에도 긍정적인 영향을 미칠 것입니다. 따라서 온라인 체크인 시스템을 고도화하면서도, 오프라인 서비스를 적절히 병행하는 하이브리드 방식의 서비스 전략이 필요하다고 할 수 있습니다.
감사합니다.