Khám phá các framework Machine Learning & AI trên nền tảng Apple (WWDC 2025)

Bài tổng quan từ WWDC 2025 giới thiệu toàn bộ hệ sinh thái ML & AI trên Apple Silicon: Foundation Models framework mới với Guided Generation và Tool Calling, bộ API hệ thống như Vision, SpeechAnalyzer, Natural Language, cùng Core ML và MLX cho nghiên cứu tiên tiến.

Bối cảnh

Tại WWDC 2025, Jaimin Upadhyay — Engineering Manager của nhóm On-Device Machine Learning tại Apple — đã trình bày một bức tranh toàn cảnh về hệ sinh thái Machine Learning và AI mà Apple cung cấp cho developer. Session này không đi sâu vào một API đơn lẻ mà cho thấy cả một "bản đồ" từ tích hợp UI đơn giản đến triển khai mô hình tùy chỉnh, và từ sử dụng framework hệ thống đến nghiên cứu tiên tiến trên Apple Silicon.

Apple phân chia rõ ràng bốn lớp: (1) Platform Intelligence — các tính năng tích hợp sẵn như Writing Tools, Genmoji, Image Playground; (2) ML-powered APIs — cho phép truy cập lập trình vào các model hệ thống; (3) Core ML — để đưa bất kỳ mô hình nào lên thiết bị; (4) MLX — cho nghiên cứu và thử nghiệm mô hình frontier.

Tại sao quan trọng với dev Việt Nam

Với developer iOS/macOS người Việt, đây là session cần xem trước khi bắt đầu bất kỳ tính năng AI nào. Apple đã xây dựng sẵn nhiều khả năng mạnh mẽ hoạt động hoàn toàn on-device, không cần API key, không tốn chi phí gọi API, và bảo vệ quyền riêng tư người dùng. Foundation Models framework mới trong iOS 26 cho phép gọi mô hình ngôn ngữ ngay trong app với ba dòng code. Đây là lợi thế cạnh tranh thực sự mà developer Apple platform có so với các nền tảng khác.

Chi tiết kỹ thuật

Chọn framework nào?

Trước khi bắt đầu, hãy xác định nhu cầu thực tế để chọn đúng framework:

Nhu cầu	Framework phù hợp
Tích hợp UI hệ thống (Writing Tools, Genmoji...)	Apple Intelligence APIs
Summarization, classification, extraction trong app	Foundation Models
Triển khai mô hình tùy chỉnh, performance-critical	Core ML
Nghiên cứu, fine-tuning, chạy LLM lớn	MLX

Foundation Models Framework (iOS 26)

Framework mới cung cấp quyền truy cập lập trình vào mô hình ngôn ngữ on-device, tối ưu hóa cho các tác vụ thường ngày: tóm tắt, trích xuất, phân loại, tạo nội dung động. Hoàn toàn miễn phí, không cần account, hoạt động offline.

Sử dụng cơ bản (3 dòng code):

import FoundationModels
let session = LanguageModelSession()
let response = try await session.respond(to: "Tóm tắt bài viết này...")

Guided Generation — Tạo response có cấu trúc trực tiếp vào kiểu Swift của bạn:

@Generable
struct TravelItinerary {
    /// Tên điểm đến
    let destination: String
    /// Danh sách hoạt động gợi ý
    let activities: [String]
}

let itinerary = try await session.respond(
    to: "Gợi ý lịch trình 3 ngày ở Đà Nẵng",
    generating: TravelItinerary.self
)

Framework tự tùy chỉnh vòng decoding để đảm bảo output luôn hợp lệ về mặt cấu trúc — không cần xử lý JSON schema thủ công.

Tool Calling — Cho phép mô hình truy cập dữ liệu thực tế (calendar, weather, app data), trích dẫn nguồn để người dùng fact-check, và thực hiện hành động trong app.

Các API hệ thống mới

ImageCreator & Image Playground (iOS 18.4)

let creator = ImageCreator()
let images = try await creator.images(for: [
    .text("Con mèo đang lướt ván"),
    .style(.watercolor)
])

Smart Reply (iOS 18.4) — Gợi ý phản hồi thông minh trong messaging và email, hoạt động on-device:

let context = UIMessage.ConversationContext(messages: messages)
entryView.conversationContext = context
// Keyboard tự hiển thị smart reply suggestions

Vision Framework — Các bổ sung mới

Vision có hơn 30 API phân tích ảnh và video. WWDC 2025 bổ sung thêm:

Document Recognition: Nhóm các cấu trúc văn bản trong tài liệu thay vì chỉ đọc từng dòng riêng lẻ, phù hợp để xử lý hóa đơn, biểu mẫu, tài liệu scan
Lens Smudge Detection: Phát hiện vết bẩn trên ống kính camera trước khi chụp

Xem chi tiết tại session "Reading documents using the Vision Framework".

SpeechAnalyzer (iOS 26)

API mới thay thế SFSpeechRecognizer, tối ưu cho audio dài hơn như bài giảng, cuộc họp, hội thoại. Hoàn toàn on-device với mô hình mới nhanh hơn và linh hoạt hơn:

let analyzer = SpeechAnalyzer()
for await result in analyzer.results {
    print(result.transcription)
}

Xem chi tiết tại session "Bring advanced speech-to-text to your app with SpeechAnalyzer".

Create ML — Mở rộng và tùy chỉnh

Create ML cho phép fine-tune các model hệ thống với dữ liệu riêng của bạn:

Image Classifier tùy chỉnh dùng với Vision framework
Word Tagger dùng với Natural Language framework
Spatial Object Recognition cho Apple Vision Pro — nhận diện và tracking vật thể tùy chỉnh với 6 degrees of freedom (6DOF) trong môi trường spatial, mở ra khả năng tương tác AR/VR chính xác cao

Core ML — Model Architecture Visualizer (Xcode mới)

Xcode năm nay bổ sung hiển thị toàn bộ kiến trúc mô hình dưới dạng đồ thị: xem chi tiết từng operation, debug bottleneck và tìm cơ hội tối ưu performance trực tiếp trong IDE. Ngoài ra, BNNSGraph thêm Graph Builder API mới để viết preprocessing/postprocessing pipelines chạy real-time trên CPU.

Core ML tự động phân phối tính toán trên CPU, GPU và Neural Engine. Models có thể tải từ developer.apple.com hoặc Apple's Hugging Face space.

MLX — Nghiên cứu tiên tiến trên Apple Silicon

MLX là framework mã nguồn mở do Apple ML researchers phát triển, tận dụng Unified Memory Architecture — CPU và GPU chia sẻ cùng vùng nhớ vật lý, không cần copy dữ liệu giữa các thiết bị.

# Chạy LLM lớn trực tiếp từ command line
mlx_lm.generate --model mistralai/Mistral-7B-v0.1 --max-tokens 1024 \
  --prompt "Viết quicksort bằng Swift"

Hỗ trợ: Python, Swift, C++, C và nhiều binding khác do cộng đồng đóng góp. Có thể chạy DeepSeek-R1 trực tiếp trên máy Mac Apple Silicon. Xem session "Explore large language models on Apple silicon with MLX".

Kết luận

WWDC 2025 đánh dấu thời điểm Apple Platform thực sự trở thành nền tảng AI hàng đầu cho developer: Foundation Models framework mang intelligence trực tiếp vào mọi app với chi phí bằng không, trong khi Core ML và MLX đáp ứng nhu cầu từ triển khai mô hình tùy chỉnh đến nghiên cứu tiên tiến. Bất kể bạn là app developer, ML engineer hay AI enthusiast, Apple đều có công cụ phù hợp — tất cả tối ưu cho Apple Silicon.