Blog Tags Projects About

All Posts

All Posts

Published on
January 30, 2026
Day 30: Quantization & Deploy Local Model API
29 min read
0
Quantization giảm memory footprint bằng cách lưu weights ở precision thấp hơn, ví dụ INT8 hoặc INT4 thay vì FP16/BF16. Nó giúp chạy model lớn hơn trên cùng phần cứng và có thể giảm cost, nhưng không t...
ai-engineer
Published on
January 30, 2026
Ngày 30: Indicators Trend Following — MA, MACD, Bollinger Bands
25 min read
0
Ngày 30: Indicators Trend Following — MA, MACD, Bollinger Bands
dau-tu phan-3-technical-analysis
Published on
January 29, 2026
Day 29: Local LLM - Ollama, llama.cpp, vLLM
27 min read
0
Local LLM không chỉ là 'tải model về máy'. Nó là một serving stack gồm model weights, tokenizer, runtime inference, quantization kernels, API server, scheduler, hardware, observability, security polic...
ai-engineer
Published on
January 29, 2026
Ngày 29: Chart Patterns — Mô Hình Giá Cổ Điển
24 min read
0
Ngày 29: Chart Patterns — Mô Hình Giá Cổ Điển
dau-tu phan-3-technical-analysis
Published on
January 28, 2026
Day 28: Evaluation trước/sau Fine-tune
29 min read
0
Fine-tune không có ý nghĩa nếu không chứng minh được chất lượng tăng trên dữ liệu chưa thấy. Train loss giảm không đồng nghĩa production quality tăng. Cách làm đúng là đóng băng một golden dataset, ch...
ai-engineer