Dự án này tập trung vào việc nghiên cứu, mô hình hóa và dự báo biến động giá đóng cửa của Bitcoin (BTC) bằng cách kết hợp mô hình trung bình trượt tích hợp tự hồi quy (ARIMA) và mô hình phương sai sai số thay đổi có điều kiện tự hồi quy tổng quát (GARCH). Đây là một phương pháp định lượng phổ biến giúp phân tích cả xu hướng giá lẫn rủi ro biến động trên thị trường tài chính đầy biến động của tiền mã hóa.
Chi tiết nghiên cứu và báo cáo đầy đủ có sẵn tại file: Final Result.pdf.
- Đối tượng nghiên cứu: Giá đóng cửa (Closing Price) của Bitcoin (BTC/USD).
- Dữ liệu sử dụng: Chuỗi giá đóng cửa theo tần suất ngày thu thập từ CoinMarketCap.
- Phạm vi thời gian: Từ ngày 06/04/2025 đến ngày 29/04/2026 (bao gồm 389 quan sát), bao quát cả chu kỳ tăng trưởng mạnh (Bull market) lẫn suy thoái sâu (Bear market) của Bitcoin.
- Công cụ thực hiện: EViews (phân tích định lượng chuyên sâu) và Microsoft Excel (tiền xử lý dữ liệu).
Trước khi đi vào mô hình hóa, chuỗi dữ liệu giá đóng cửa Bitcoin được phân tích thống kê mô tả:
- Giá trung bình (Mean): $95,879.36 USD
- Giá trung vị (Median): $96,492.34 USD
- Giá cao nhất (Max): $124,752.50 USD
- Giá thấp nhất (Min): $62,702.10 USD
- Độ lệch chuẩn (Std. Dev.): $17,205.74 (cho thấy mức độ biến động và rủi ro cực kỳ cao).
-
Kiểm định phân phối chuẩn (Jarque-Bera): Đạt giá trị
$29.004$ với hệ số ý nghĩa$P\text{-value} = 0.000001 < 0.01$ . Kết quả bác bỏ giả thuyết$H_0$ , xác nhận chuỗi dữ liệu không tuân theo phân phối chuẩn (phân phối dẹt, lệch trái nhẹ với hệ số skewness$-0.307041$ và kurtosis$1.811570$ ).
Nghiên cứu tuân thủ nghiêm ngặt quy trình định lượng chuỗi thời gian qua 6 bước cốt lõi:
graph TD
A[Mô tả thực trạng dữ liệu] --> B[Kiểm định tính dừng ADF]
B --> C[Xây dựng mô hình ARIMA Box-Jenkins]
C --> D[Kiểm định hiệu ứng ARCH LM-test]
D --> E[Xây dựng mô hình hỗn hợp GARCH]
E --> F[Dự báo tĩnh & động ngoài mẫu]
- Kiểm định Augmented Dickey-Fuller (ADF) trên chuỗi giá gốc (
$CLOSE$ ) cho thấy chuỗi không dừng ở tất cả các dạng (không hệ số chặn/xu thế, có hệ số chặn, có hệ số chặn & xu thế). - Tiến hành lấy sai phân bậc 1 (
$DCLOSE$ ). Kiểm định ADF trên chuỗi$DCLOSE$ đạt giá trị thống kê xấp xỉ$-20.3$ ($P\text{-value} < 0.01$ ). -
Kết luận: Chuỗi dữ liệu dừng ở sai phân bậc 1, tích hợp bậc
$d = 1$ .
- Dựa trên giản đồ tự tương quan (ACF) và tự tương quan riêng phần (PACF) của chuỗi sai phân bậc 1, tiến hành thử nghiệm và so sánh nhiều cấu trúc mô hình dựa trên tiêu chuẩn thông tin tối ưu (AIC, BIC).
- Mô hình tối ưu được lựa chọn là ARIMA(0, 1, {7, 9}) hay chính là mô hình MA(7, 9) cho chuỗi sai phân, với chỉ số AIC thấp nhất (18.060) và BIC thấp thứ hai (18.087).
-
Phương trình trung bình:
$$\Delta Y_t = \varepsilon_t + \theta_7 \varepsilon_{t-7} + \theta_9 \varepsilon_{t-9}$$ Ý nghĩa: Biến động giá Bitcoin hôm nay không phụ thuộc nhiều vào xu hướng ngắn hạn của 1-2 ngày trước mà chịu ảnh hưởng bởi các "cú sốc/sai số" của thị trường từ 7 và 9 ngày trước đó.
- Tính ổn định: Tất cả các nghiệm nghịch đảo của đa thức MA (Inverted MA Roots) đều nằm trong đường tròn đơn vị, xác nhận mô hình hoàn toàn khả nghịch (Invertible) và ổn định.
-
Nhiễu trắng: Kiểm định Ljung-Box Q-test trên phần dư cho thấy các giá trị
$P\text{-value}$ đều lớn hơn$0.05$ , chứng minh phần dư không còn tự tương quan.
- Kiểm định ARCH-LM trên phần dư của mô hình MA(7, 9) cho thấy chỉ số
$Obs \times R^2 = 15.73794$ với$P\text{-value} = 0.0001 < 0.05$ . -
Kết luận: Bác bỏ giả thuyết phương sai sai số không đổi
$\rightarrow$ Tồn tại hiện tượng biến động cụm (volatility clustering) và phương sai sai số thay đổi theo thời gian (hiệu ứng ARCH). Do đó, việc áp dụng mô hình GARCH là bắt buộc.
Để giải quyết hiệu ứng ARCH, mô hình GARCH(1, 1) được tích hợp vào cấu trúc MA(7, 9). Kết quả ước lượng bằng EViews thu được như sau:
- Cả hai hệ số MA(7) và MA(9) đều có ý nghĩa thống kê ở mức
$5%$ ($P\text{-value}$ lần lượt là$0.0468$ và$0.0053$ ).
-
Hệ số ARCH (
$\alpha_1 = 0.135102$ ): Phản ánh mức độ nhạy cảm của biến động đối với các tin tức mới trên thị trường. -
Hệ số GARCH (
$\beta_1 = 0.502082$ ): Cho thấy ảnh hưởng lâu dài (tính bền bỉ) của biến động quá khứ đối với biến động hiện tại. -
Độ bền vững (
$\alpha_1 + \beta_1 = 0.637184 < 1$ ): Đảm bảo phương sai dài hạn ổn định và hội tụ về mức trung bình dài hạn.
- Kiểm định tự tương quan (Ljung-Box) trên phần dư chuẩn hóa đạt
$P\text{-value} > 0.05$ ở mọi độ trễ. - Kiểm định ARCH-LM trên phần dư chuẩn hóa thu được
$P\text{-value} = 0.9985 > 0.05$ (không còn hiệu ứng ARCH). -
$\rightarrow$ Mô hình hỗn hợp đã khắc phục hoàn toàn các khuyết tật của mô hình ARIMA thông thường, phần dư đạt trạng thái nhiễu trắng chuẩn hóa.
Mô hình MA(7,9) - GARCH(1,1) được sử dụng để tiến hành dự báo động ngoài mẫu cho 10 ngày tiếp theo (từ 30/04/2026 đến 09/05/2026) và so sánh với giá trị thực tế của thị trường:
| Ngày | Giá Dự Báo (USD) | Giá Thực Tế (USD) | Sai Số (MAPE) |
|---|---|---|---|
| 30/04/2026 | 75,745.36 | 76,304.32 | 0.73% |
| 01/05/2026 | 75,362.51 | 78,179.00 | 3.60% |
| 02/05/2026 | 75,400.52 | 78,657.24 | 4.14% |
| 03/05/2026 | 75,644.72 | 78,538.22 | 3.68% |
| 04/05/2026 | 75,452.56 | 79,827.91 | 5.48% |
| 05/05/2026 | 75,154.02 | 80,927.05 | 7.13% |
| 06/05/2026 | 75,317.61 | 81,427.53 | 7.50% |
| 07/05/2026 | 75,481.32 | 80,009.99 | 5.66% |
| 08/05/2026 | 75,555.39 | 80,186.76 | 5.78% |
| 09/05/2026 | 75,555.39 | 80,664.37 | 6.33% |
| Trung bình | - | - | ~5.00% |
- Độ chính xác cao: Sai số phần trăm tuyệt đối trung bình (MAPE) đạt xấp xỉ 5.00% trong thời gian 10 ngày ngoài mẫu. Đối với một tài sản tài chính có độ biến động cực kỳ lớn như Bitcoin, đây là một hiệu suất dự báo ngắn hạn rất ấn tượng.
-
Đặc tính mô hình: Dự báo động có xu hướng đi ngang quanh mức
$75,555$ USD từ sau bước thứ 9 (do tính chất triệt tiêu của mô hình MA). Mô hình chưa bắt kịp hoàn toàn xu thế tăng mạnh của thị trường thực tế (giá thực tế tăng lên trên$80,000$ USD). Điều này là do mô hình ARIMA-GARCH dựa thuần túy trên dữ liệu lịch sử quá khứ và giả định không có yếu tố bên ngoài đột biến.
├── Data/
│ └── Bitcoin_06_04_2025-29_04_2026_historical_data_coinmarketcap.xlsx # Dữ liệu gốc thu thập từ CoinMarketCap
├── Final Result.pdf # Báo cáo chi tiết kết quả nghiên cứu
└── README.md # Giới thiệu dự án (File này)
- Kết luận: Sự kết hợp giữa ARIMA (đại diện cho cấu trúc trung bình) và GARCH (đại diện cho cấu trúc phương sai biến động) cung cấp một mô hình dự báo tài chính chặt chẽ, giải quyết tốt các vấn đề về biến động mạnh và bất định của Bitcoin.
- Hạn chế: Mô hình chỉ dự báo hiệu quả trong ngắn hạn (dưới 10 ngày). Trong dài hạn, các dự báo có xu hướng hội tụ về giá trị kỳ vọng trung bình.
- Hướng phát triển: Tích hợp thêm các biến ngoại sinh (như khối lượng giao dịch, chỉ số tâm lý thị trường Fear & Greed Index, tin tức vĩ mô) thông qua mô hình ARIMAX-GARCH hoặc các phương pháp học sâu (LSTM, GRU) để nâng cao độ chính xác dự báo dài hạn.