Ai-engineer

All Posts

Published on
December 31, 2099
Tổng hợp tất cả các series
4 min read
0
Trang index tổng hợp toàn bộ các series trên blog — AI Engineer, Python, Đầu tư, Claude Code Practical Course. Dùng để tìm kiếm nhanh nội dung theo chủ đề.
tong-hop ai-engineer python dau-tu claude-lession
Published on
February 19, 2026
Day 50: README, Demo, Blog, CV/LinkedIn
16 min read
0
Day 50 biến capstone từ 'project chạy được' thành 'portfolio artifact thuyết phục'. Reviewer không chỉ cần thấy chatbot trả lời, mà cần thấy bạn hiểu production RAG: ingestion, hybrid retrieval, reran...
ai-engineer
Published on
February 18, 2026
Day 49: UI, Monitoring, Evaluation Report
14 min read
0
Day 49 biến backend/API của Day 48 thành capstone có thể demo và review. UI không cần phức tạp, nhưng phải cho thấy answer có citation, source nào được dùng, request chậm ở đâu, tốn bao nhiêu token/co...
ai-engineer
Published on
February 17, 2026
Day 48: Capstone Architecture Review + Backend/API
15 min read
0
Day 48 là ngày chuyển các bài học rời rạc thành capstone có architecture rõ. Mục tiêu không phải thêm feature vô hạn, mà là đóng scope, làm backend/API có boundary tốt, có ingestion path, query path,...
ai-engineer
Published on
February 16, 2026
Day 47: LLM Testing, Golden Set, CI/CD Cho Prompt/RAG
15 min read
0
LLM/RAG không thể release dựa trên cảm giác 'chat thử thấy ổn'. Golden set chính là regression test suite của hệ thống AI. Mỗi lần đổi prompt, chunking, embedding model, reranker, retrieval top-k, LLM...
ai-engineer
Published on
February 15, 2026
Day 46: Guardrails
18 min read
1
Trong production, LLM output phải được xem như untrusted input. Prompt chỉ là một lớp mềm. Hệ thống cần enforce policy bằng code: validate request, filter permission trước retrieval, sanitize retrieve...
ai-engineer
Published on
February 14, 2026
Day 45: Cost Optimization Cho LLM/RAG Production
40 min read
1
Sau Day 45, bạn cần nhìn một LLM/RAG app và trả lời được:
ai-engineer
Published on
February 13, 2026
Day 44: Observability Cho LLM App
41 min read
0
Sau bài này, bạn cần làm được các việc sau:
ai-engineer
Published on
February 12, 2026
Day 43: Docker/K8s/GPU Serving Cho AI Workload
42 min read
0
Day 43 tập trung vào deployment layer cho AI system. Sau Day 40-42, bạn đã có RAG/LLM service, streaming API và các lựa chọn serving như managed LLM, vLLM hoặc TGI. Bài này trả lời câu hỏi thực tế hơn...
ai-engineer
Published on
February 11, 2026
Day 42: Model Serving Với FastAPI, SSE Và Production Boundary
36 min read
0
Sau Day 42, bạn cần build được một serving layer cho model hoặc RAG pipeline có các đặc điểm sau:
ai-engineer
Published on
February 10, 2026
Day 41: MLflow, Experiment Tracking Và Model Registry
27 min read
0
Mục tiêu của Day 41 không phải là mở MLflow UI cho đẹp. Mục tiêu là tạo được một audit trail đủ tin cậy để khi model được deploy, team có thể trả lời:
ai-engineer
Published on
February 9, 2026
Day 40: Mini-project - Production RAG System End-to-end
40 min read
0
Day 40 là bài tổng hợp của Phase 5. Mục tiêu không phải tạo một chatbot demo đẹp mắt, mà là build một RAG system có đủ các boundary mà production cần:
ai-engineer
Published on
February 8, 2026
Day 39: RAG Evaluation Production
45 min read
0
Một RAG system có nhiều bước hơn một chatbot thông thường:
ai-engineer
Published on
February 7, 2026
Day 38: Advanced RAG Patterns Production
37 min read
0
Từ Day 31 đến Day 37, bạn đã có các khối nền tảng:
ai-engineer
Published on
February 6, 2026
Day 37: Reranking Cho Production RAG
28 min read
0
Trong Day 36, pipeline Hybrid Search đã lấy candidate bằng BM25, dense retrieval và Reciprocal Rank Fusion. Bước đó tối ưu cho recall: cố gắng không bỏ sót chunk có khả năng liên quan. Nhưng top resul...
ai-engineer
Published on
February 5, 2026
Day 36: Hybrid Search Production
37 min read
0
Trong RAG, retriever quyết định LLM nhìn thấy tài liệu nào. Nếu retriever bỏ sót tài liệu đúng, prompt tốt đến đâu cũng khó cứu được câu trả lời.
ai-engineer
Published on
February 4, 2026
Day 35: Metadata, Citation, Permission-aware RAG
25 min read
0
Production RAG không được chỉ làm `embed query -> vector search -> nhét top_k vào prompt`. Mỗi chunk phải có metadata đủ để filter, cite, audit, version và delete. Permission-aware RAG phải enforce AC...
ai-engineer
Published on
February 3, 2026
Day 34: Chunking Strategies
28 min read
0
Chunking là cách cắt tài liệu dài thành các record nhỏ hơn để đưa vào embedding, vector database, reranker và context của LLM. Trong RAG, chunk không chỉ là đoạn text. Chunk là đơn vị retrieval, citat...
ai-engineer
Published on
February 2, 2026
Day 33: Vector DB Production
26 min read
1
Trong RAG, câu hỏi của user được biến thành embedding, sau đó hệ thống tìm các đoạn tài liệu có ý nghĩa gần nhất:
ai-engineer
Published on
February 1, 2026
Day 32: Embedding Models & Benchmark cho tiếng Việt
31 min read
0
Embedding biến text thành vector số để text gần nghĩa nằm gần nhau trong vector space. Trong RAG, embedding quyết định retriever có lấy đúng tài liệu trước khi LLM sinh câu trả lời hay không. Với tiến...
ai-engineer
Published on
January 31, 2026
Day 31: RAG Architecture
28 min read
0
RAG = Retrieval + Generation. Thay vì nhồi toàn bộ knowledge vào prompt hoặc fine-tune model chỉ để nhớ facts, hệ thống sẽ retrieve các đoạn tài liệu liên quan từ source of truth, đưa chúng vào contex...
ai-engineer
Published on
January 30, 2026
Day 30: Quantization & Deploy Local Model API
29 min read
0
Quantization giảm memory footprint bằng cách lưu weights ở precision thấp hơn, ví dụ INT8 hoặc INT4 thay vì FP16/BF16. Nó giúp chạy model lớn hơn trên cùng phần cứng và có thể giảm cost, nhưng không t...
ai-engineer
Published on
January 29, 2026
Day 29: Local LLM - Ollama, llama.cpp, vLLM
27 min read
0
Local LLM không chỉ là 'tải model về máy'. Nó là một serving stack gồm model weights, tokenizer, runtime inference, quantization kernels, API server, scheduler, hardware, observability, security polic...
ai-engineer
Published on
January 28, 2026
Day 28: Evaluation trước/sau Fine-tune
29 min read
0
Fine-tune không có ý nghĩa nếu không chứng minh được chất lượng tăng trên dữ liệu chưa thấy. Train loss giảm không đồng nghĩa production quality tăng. Cách làm đúng là đóng băng một golden dataset, ch...
ai-engineer
Published on
January 27, 2026
Day 27: LoRA/QLoRA Hands-on
22 min read
0
LoRA không train lại toàn bộ model. Nó freeze base model và chỉ train các low-rank adapter nhỏ gắn vào một số linear layer. QLoRA đi thêm một bước: base model được load ở 4-bit quantization để giảm VR...
ai-engineer
Published on
January 26, 2026
Day 26: Dataset Preparation cho Instruction Tuning
30 min read
0
Instruction tuning dataset là tập ví dụ mô tả behavior mà bạn muốn model học. Mỗi record nói với model: khi người dùng hỏi kiểu này, assistant nên trả lời theo format, tone, policy và mức độ chi tiết...
ai-engineer
Published on
January 25, 2026
Day 25: Khi nào Fine-tune, khi nào dùng RAG
34 min read
0
RAG đưa knowledge từ nguồn bên ngoài vào runtime context. Tool calling lấy realtime data hoặc thực hiện action qua API. Fine-tuning thay đổi behavior của model bằng training data. Prompt engineering l...
ai-engineer
Published on
January 24, 2026
Day 24: Mini-project - AI Assistant có Tool Calling + Memory
13 min read
0
Build một **Support AI Assistant API backend** nhỏ nhưng có boundary gần production:
ai-engineer
Published on
January 23, 2026
Day 23: Security Basics Cho LLM App
31 min read
0
LLM app security không thể dựa vào câu 'hãy tuân thủ policy' trong system prompt. LLM đọc chung instruction, user input, retrieved documents, memory và tool results trong một ngữ cảnh ngôn ngữ; nó khô...
ai-engineer
Published on
January 22, 2026
Day 22: Agent Patterns với LangGraph
26 min read
0
Agent production nên được thiết kế như một state machine có LLM ở một vài node, không phải một prompt dài rồi hy vọng model tự xử lý đúng. LangGraph giúp biểu diễn workflow bằng node, edge, state, con...
ai-engineer
Published on
January 21, 2026
Day 21: Raw SDK vs LangChain vs LlamaIndex vs LangGraph
39 min read
0
Không có framework nào là 'best' cho mọi LLM app. Best solution phụ thuộc vào shape của bài toán, SLA, độ phức tạp workflow, volume, yêu cầu audit, năng lực team và tốc độ thay đổi sản phẩm.
ai-engineer
Published on
January 20, 2026
Day 20: LLM App Architecture cho Production
26 min read
0
LLM app production là một distributed system có dependency chậm, đắt tiền, không deterministic và có rủi ro security riêng. Nếu mỗi feature team gọi provider SDK trực tiếp, hệ thống sẽ nhanh chóng mất...
ai-engineer
Published on
January 19, 2026
Day 19: Structured Output & Function Calling
21 min read
0
Structured output biến LLM từ một text generator thành một component có contract gần giống API response. Function calling không có nghĩa model tự chạy function. Model chỉ đề xuất tool name và argument...
ai-engineer
Published on
January 18, 2026
Day 18: Prompt Engineering Thực Chiến
24 min read
0
Prompt engineering production không phải là viết câu 'hay hơn'. Nó là thiết kế một contract giữa application và một runtime xác suất. Prompt tốt có nhiệm vụ rõ, input boundary rõ, context đủ, example...
ai-engineer
Published on
January 17, 2026
Day 17: LLM Fundamentals
26 min read
0
LLM là một runtime xác suất: nó nhận context, biến text thành token, dự đoán token tiếp theo, rồi lặp lại cho đến khi dừng. Khả năng chat tốt đến từ `SFT` và `preference tuning`; kiến thức rộng đến từ...
ai-engineer
Published on
January 16, 2026
Day 16: Mini-project - Fine-tune PhoBERT/BERT Classifier
23 min read
0
Day 16 là mini-project tổng hợp Phase 2: Deep Learning, NLP và Transformer. Cách làm đúng không phải nhảy thẳng vào PhoBERT, mà là bắt đầu bằng baseline đơn giản, đo metric, hiểu lỗi, rồi mới fine-tun...
ai-engineer
Published on
January 15, 2026
Day 15: Hugging Face Ecosystem
26 min read
0
Hugging Face là ecosystem giúp bạn dùng model AI giống cách Senior Software Engineer dùng package registry, artifact registry và SDK. `transformers` cung cấp model/tokenizer API, `datasets` xử lý data...
ai-engineer
Published on
January 14, 2026
Day 14: Transformer Architecture
32 min read
0
Transformer là kiến trúc xử lý sequence bằng cách lặp nhiều Transformer block. Mỗi block thường có self-attention để trộn thông tin giữa các token, FFN để biến đổi representation của từng token, resid...
ai-engineer
Published on
January 13, 2026
Day 13: Attention Mechanism
21 min read
0
Attention là cơ chế để mỗi token chọn thông tin quan trọng từ các token khác.
ai-engineer
Published on
January 12, 2026
Day 12: NLP Fundamentals & Tokenizer
27 min read
0
Tokenizer là contract giữa raw text và model weights. Cùng một câu nhưng dùng tokenizer khác sẽ ra token ids khác, nghĩa là model đang nhìn một input khác. Với LLM/RAG, token không chỉ là chi tiết kỹ...
ai-engineer
Published on
January 11, 2026
Day 11: Training Loop, Optimizer, Scheduler
33 min read
0
Training loop là runtime engine của deep learning. Một batch đi qua model, model tạo prediction, loss đo sai số, autograd tính gradient, optimizer cập nhật weights. Scheduler điều chỉnh learning rate...
ai-engineer
Published on
January 10, 2026
Day 10: PyTorch Fundamentals
21 min read
0
Sau bài này, bạn cần làm được các việc sau:
ai-engineer
Published on
January 9, 2026
Day 9: Neural Network từ Zero
29 min read
0
Neural network là một hàm có nhiều layer. Mỗi layer nhận input dạng ma trận, nhân với weight, cộng bias, rồi đi qua activation:
ai-engineer
Published on
January 8, 2026
Day 8: Mini-project - Customer Churn ML Pipeline
33 min read
0
Customer churn prediction là bài toán binary classification: dự đoán xác suất một customer sẽ rời bỏ dịch vụ trong một horizon cụ thể, ví dụ 30 ngày hoặc cuối kỳ hợp đồng. Một pipeline tốt cần nhất qu...
ai-engineer
Published on
January 7, 2026
Day 7: Error Analysis, Data Leakage, Threshold Tuning
22 min read
1
Classification model không kết thúc ở `model.predict`. Trong production, model thường trả probability, còn quyết định cuối cùng phụ thuộc vào threshold, capacity, cost và policy. Error analysis là bướ...
ai-engineer
Published on
January 6, 2026
Day 6: Model Evaluation Metrics
35 min read
0
Evaluation metric là test suite của ML system, nhưng khác unit test ở chỗ output thường là xác suất và quyết định phụ thuộc business context. Không có 'metric tốt nhất' cho mọi bài toán. Accuracy chỉ...
ai-engineer
Published on
January 5, 2026
Day 5: Feature Engineering
21 min read
0
Feature engineering là lớp contract giữa data system và model. Với Senior SE, hãy nghĩ feature như API schema: tên cột, type, nullability, semantics và thời điểm dữ liệu đều phải rõ. Model tốt không c...
ai-engineer
Published on
January 4, 2026
Day 4: Python ML Stack
25 min read
0
Python ML stack phổ biến gồm NumPy cho numerical compute, Pandas cho data wrangling, scikit-learn cho training pipeline, Matplotlib/Seaborn cho visualization và joblib cho artifact nhỏ-vừa. Với Senior...
ai-engineer
Published on
January 3, 2026
Day 3: ML Fundamentals
27 min read
0
Machine Learning là cách xây một function từ data thay vì viết toàn bộ rule bằng tay. Với Senior SE, hãy nhìn model như một dependency có contract xác suất: input giống nhau có thể ổn định, nhưng qual...
ai-engineer
Published on
January 2, 2026
Day 2: Math đủ dùng cho ML
23 min read
0
Math trong ML không cần bắt đầu bằng proof. Với AI Engineer thiên production, bạn cần hiểu vector là numeric representation, dot product/cosine là cách đo độ gần, matrix multiplication là cách scale t...
ai-engineer
Published on
January 1, 2026
AI Engineer tổng hợp
3 min read
0
Series ghi lại quá trình học khóa AI Engineer từ Senior SE sang GenAI/RAG/LLM Production Engineer trong 50 ngày
ai-engineer
Published on
January 1, 2026
Day 1: AI Mindset cho Senior SE
27 min read
1
AI system không chỉ là 'gọi model'. Với Senior SE, cách nhìn đúng là:
ai-engineer

Ai-engineer

ai-engineer (52)