Bối cảnh
Tại WWDC 2025, Jaimin Upadhyay — Engineering Manager của nhóm On-Device Machine Learning tại Apple — đã trình bày một bức tranh toàn cảnh về hệ sinh thái Machine Learning và AI mà Apple cung cấp cho developer. Session này không đi sâu vào một API đơn lẻ mà cho thấy cả một "bản đồ" từ tích hợp UI đơn giản đến triển khai mô hình tùy chỉnh, và từ sử dụng framework hệ thống đến nghiên cứu tiên tiến trên Apple Silicon.
Apple phân chia rõ ràng bốn lớp: (1) Platform Intelligence — các tính năng tích hợp sẵn như Writing Tools, Genmoji, Image Playground; (2) ML-powered APIs — cho phép truy cập lập trình vào các model hệ thống; (3) Core ML — để đưa bất kỳ mô hình nào lên thiết bị; (4) MLX — cho nghiên cứu và thử nghiệm mô hình frontier.
Tại sao quan trọng với dev Việt Nam
Với developer iOS/macOS người Việt, đây là session cần xem trước khi bắt đầu bất kỳ tính năng AI nào. Apple đã xây dựng sẵn nhiều khả năng mạnh mẽ hoạt động hoàn toàn on-device, không cần API key, không tốn chi phí gọi API, và bảo vệ quyền riêng tư người dùng. Foundation Models framework mới trong iOS 26 cho phép gọi mô hình ngôn ngữ ngay trong app với ba dòng code. Đây là lợi thế cạnh tranh thực sự mà developer Apple platform có so với các nền tảng khác.
Chi tiết kỹ thuật
Chọn framework nào?
Trước khi bắt đầu, hãy xác định nhu cầu thực tế để chọn đúng framework:
| Nhu cầu | Framework phù hợp |
|---|---|
| Tích hợp UI hệ thống (Writing Tools, Genmoji...) | Apple Intelligence APIs |
| Summarization, classification, extraction trong app | Foundation Models |
| Triển khai mô hình tùy chỉnh, performance-critical | Core ML |
| Nghiên cứu, fine-tuning, chạy LLM lớn | MLX |
Foundation Models Framework (iOS 26)
Framework mới cung cấp quyền truy cập lập trình vào mô hình ngôn ngữ on-device, tối ưu hóa cho các tác vụ thường ngày: tóm tắt, trích xuất, phân loại, tạo nội dung động. Hoàn toàn miễn phí, không cần account, hoạt động offline.
Sử dụng cơ bản (3 dòng code):
import FoundationModels
let session = LanguageModelSession()
let response = try await session.respond(to: "Tóm tắt bài viết này...")Guided Generation — Tạo response có cấu trúc trực tiếp vào kiểu Swift của bạn:
@Generable
struct TravelItinerary {
/// Tên điểm đến
let destination: String
/// Danh sách hoạt động gợi ý
let activities: [String]
}
let itinerary = try await session.respond(
to: "Gợi ý lịch trình 3 ngày ở Đà Nẵng",
generating: TravelItinerary.self
)Framework tự tùy chỉnh vòng decoding để đảm bảo output luôn hợp lệ về mặt cấu trúc — không cần xử lý JSON schema thủ công.
Tool Calling — Cho phép mô hình truy cập dữ liệu thực tế (calendar, weather, app data), trích dẫn nguồn để người dùng fact-check, và thực hiện hành động trong app.
Các API hệ thống mới
ImageCreator & Image Playground (iOS 18.4)
let creator = ImageCreator()
let images = try await creator.images(for: [
.text("Con mèo đang lướt ván"),
.style(.watercolor)
])Smart Reply (iOS 18.4) — Gợi ý phản hồi thông minh trong messaging và email, hoạt động on-device:
let context = UIMessage.ConversationContext(messages: messages)
entryView.conversationContext = context
// Keyboard tự hiển thị smart reply suggestionsVision Framework — Các bổ sung mới
Vision có hơn 30 API phân tích ảnh và video. WWDC 2025 bổ sung thêm:
- Document Recognition: Nhóm các cấu trúc văn bản trong tài liệu thay vì chỉ đọc từng dòng riêng lẻ, phù hợp để xử lý hóa đơn, biểu mẫu, tài liệu scan
- Lens Smudge Detection: Phát hiện vết bẩn trên ống kính camera trước khi chụp
Xem chi tiết tại session "Reading documents using the Vision Framework".
SpeechAnalyzer (iOS 26)
API mới thay thế SFSpeechRecognizer, tối ưu cho audio dài hơn như bài giảng, cuộc họp, hội thoại. Hoàn toàn on-device với mô hình mới nhanh hơn và linh hoạt hơn:
let analyzer = SpeechAnalyzer()
for await result in analyzer.results {
print(result.transcription)
}Xem chi tiết tại session "Bring advanced speech-to-text to your app with SpeechAnalyzer".
Create ML — Mở rộng và tùy chỉnh
Create ML cho phép fine-tune các model hệ thống với dữ liệu riêng của bạn:
- Image Classifier tùy chỉnh dùng với Vision framework
- Word Tagger dùng với Natural Language framework
- Spatial Object Recognition cho Apple Vision Pro — nhận diện và tracking vật thể tùy chỉnh với 6 degrees of freedom (6DOF) trong môi trường spatial, mở ra khả năng tương tác AR/VR chính xác cao
Core ML — Model Architecture Visualizer (Xcode mới)
Xcode năm nay bổ sung hiển thị toàn bộ kiến trúc mô hình dưới dạng đồ thị: xem chi tiết từng operation, debug bottleneck và tìm cơ hội tối ưu performance trực tiếp trong IDE. Ngoài ra, BNNSGraph thêm Graph Builder API mới để viết preprocessing/postprocessing pipelines chạy real-time trên CPU.
Core ML tự động phân phối tính toán trên CPU, GPU và Neural Engine. Models có thể tải từ developer.apple.com hoặc Apple's Hugging Face space.
MLX — Nghiên cứu tiên tiến trên Apple Silicon
MLX là framework mã nguồn mở do Apple ML researchers phát triển, tận dụng Unified Memory Architecture — CPU và GPU chia sẻ cùng vùng nhớ vật lý, không cần copy dữ liệu giữa các thiết bị.
# Chạy LLM lớn trực tiếp từ command line
mlx_lm.generate --model mistralai/Mistral-7B-v0.1 --max-tokens 1024 \
--prompt "Viết quicksort bằng Swift"Hỗ trợ: Python, Swift, C++, C và nhiều binding khác do cộng đồng đóng góp. Có thể chạy DeepSeek-R1 trực tiếp trên máy Mac Apple Silicon. Xem session "Explore large language models on Apple silicon with MLX".
Kết luận
WWDC 2025 đánh dấu thời điểm Apple Platform thực sự trở thành nền tảng AI hàng đầu cho developer: Foundation Models framework mang intelligence trực tiếp vào mọi app với chi phí bằng không, trong khi Core ML và MLX đáp ứng nhu cầu từ triển khai mô hình tùy chỉnh đến nghiên cứu tiên tiến. Bất kể bạn là app developer, ML engineer hay AI enthusiast, Apple đều có công cụ phù hợp — tất cả tối ưu cho Apple Silicon.