Banner

Data Scientist (Customer profile)

Nơi làm việc
Tầng 2, Toà N03T1, Khu đô thị Ngoại giao đoàn, Bắc Từ Liêm, Hà Nội
Hình thức
Toàn thời gian
Mức lương
Thỏa thuận
Hạn chót nhận hồ sơ
30/09/2025
Trong suốt hành trình gần 31 năm tiên phong, MISA tự hào là công ty hàng đầu Việt Nam cung cấp giải pháp chuyển đổi số toàn diện SaaS (Software-as-a-Service) với gần 60 sản phẩm, ứng dụng cho 350.000 khách hàng là cơ quan nhà nước, doanh nghiệp, hộ kinh doanh và 3.5 triệu khách hàng cá nhân tại Việt Nam và 22 quốc gia trên thế giới. MISA vinh dự khi được đồng hành cùng các Bộ, ban, ngành trong chương trình Chuyển đổi số quốc gia, tự động hóa hoạt động quản lý, kinh doanh, giúp nâng cao năng suất và góp phần vào sự phát triển chung của Việt Nam.
Với tinh thần "Nỗ lực sáng tạo vì một thế giới thông minh bằng sản phẩm công nghệ trí tuệ Việt", chúng tôi mong muốn được đồng hành cùng bạn, kiến tạo nên những thành tựu đột phá.
Mô tả công việc

Vai trò thiết yếu:

  • Thực hiện phân tích, xử lý và chuẩn bị dữ liệu phục vụ huấn luyện/tinh chỉnh các mô hình LLM.
  • Áp dụng các kỹ thuật NLP để làm sạch, chuẩn hóa và biến dữ liệu thô thành dữ liệu chất lượng cao.
  • Đảm bảo dữ liệu phù hợp với yêu cầu kỹ thuật, đáp ứng tiêu chuẩn chất lượng và tuân thủ quy định pháp lý.
  • Phối hợp với Data Engineers, Data Stewards và AI Engineers để bảo đảm dữ liệu huấn luyện được sẵn sàng và tối ưu cho các pipeline pre-training/fine-tuning LLM.


Trách nhiệm thiết yếu:

  • Thu thập, tiền xử lý và làm sạch dữ liệu văn bản tiếng Việt từ nhiều nguồn (tài chính, pháp luật, kế toán, quản trị doanh nghiệp…).
  • Áp dụng các kỹ thuật NLP như tokenization, sentence segmentation, deduplication, normalization để chuẩn hóa dữ liệu.
  • Thực hiện đánh giá chất lượng dữ liệu (Data Quality Score, tính đa dạng, tính cân bằng corpus).
  • Xây dựng và duy trì các pipeline xử lý dữ liệu NLP bán tự động phục vụ huấn luyện mô hình.
  • Gắn nhãn dữ liệu ở mức cơ bản hoặc phối hợp với Data Labeling Specialists để đảm bảo tính chính xác và tính nhất quán.
  • Làm việc cùng AI Engineers để kiểm thử dữ liệu đầu vào cho pre-training/fine-tuning, đánh giá tính phù hợp và hiệu quả.
  • Đề xuất cải tiến kỹ thuật nhằm tăng hiệu quả xử lý dữ liệu và tối ưu chi phí.
Yêu cầu công việc

Học vấn:

  • Cử nhân hoặc Thạc sĩ chuyên ngành Khoa học dữ liệu, Trí tuệ nhân tạo, Công nghệ Thông tin hoặc các lĩnh vực liên quan.


Kinh nghiệm:

  • 3–5 năm kinh nghiệm trong xử lý dữ liệu văn bản hoặc NLP.
  • Trải nghiệm thực tế trong các dự án chuẩn bị dữ liệu cho huấn luyện mô hình NLP/LLM.


Kiến thức và kỹ năng:

  • Thành thạo Python và các thư viện NLP (Hugging Face, SpaCy, NLTK, OpenNMT).
  • Kinh nghiệm trong làm sạch dữ liệu, text augmentation, deduplication và corpus building.
  • Hiểu biết về các yêu cầu dữ liệu cho pre-training/fine-tuning LLM (khối lượng, tính đa dạng, domain-specific corpora).
  • Kỹ năng phân tích dữ liệu, đánh giá chất lượng và trực quan hóa kết quả.
  • Khả năng làm việc nhóm, giao tiếp hiệu quả với các nhóm AI/ML và kỹ thuật dữ liệu.


Ưu tiên:

  • Kinh nghiệm làm việc với dữ liệu tiếng Việt hoặc ngôn ngữ có tính đa dạng cú pháp cao.
  • Hiểu biết về các xu hướng mới trong chuẩn bị dữ liệu cho LLM: synthetic data generation, data augmentation pipelines.
  • Nắm vững quy định pháp lý quốc tế và trong nước về dữ liệu (GDPR, Decree 13/2023/NĐ-CP).
Quyền lợi

Tiên phong công nghệ, uy tín

  • MISA là doanh nghiệp CNTT xuất sắc nhất khu vực Châu Á - Châu Đại Dương. Tiên phong xuất khẩu giải pháp SaaS
  • TOP đầu doanh nghiệp CNTT tăng trưởng liên tục với quy mô nhân sự tăng 20%/năm, doanh thu tăng 15%/năm
  • Hội tụ 3000 nhân tài cùng khát vọng đưa sản phẩm công nghệ “Make In Vietnam” vươn tầm quốc tế
  • Xây dựng niềm tin với 270.000 khách hàng là đơn vị HCSN, doanh nghiệp, 2.5 triệu khách hàng cá nhân tại Việt Nam và 20 quốc gia
  • Hơn 100 giải thưởng trong ngành CNTT trong nước và quốc tế

Nền tảng vững chắc cho phát triển sự nghiệp, thăng tiến, quyền lợi

  • Lương cứng cạnh tranh. Thưởng năng suất dựa trên kết quả công việc từ 2 tháng lương.
  • Đánh giá review lương 2 lần/năm, thưởng sáng kiến...
  • Huấn luyện “Hổ tướng”: chương trình đào tạo quản lý tài năng, bệ phóng trở thành Chiến tướng tinh nhuệ
  • Giải thưởng “Gấu vàng": nơi tôn vinh những tài năng xuất sắc nhất
  • Gói chăm sóc sức khỏe toàn diện tại Medlatec, cháy hết mình tại các CLB theo sở thích, chương trình teambuilding, du lịch định kỳ

Môi trường thân thiện, chia sẻ, đồng hành

  • Kết nối tài năng: tập trung phát triển những con người có chung lý tưởng, mục tiêu, cùng trao giá trị và nhận thành công
  • Tư duy đột phá: môi trường tôn trọng sự khác biệt và đề cao sáng tạo, MISA-er được tự do phát triển các ý tưởng tiến bộ, cải tiến công việc
  • Công nghệ cao: trang bị máy tính làm việc, tối ưu hiệu suất công việc bằng ứng dụng công nghệ, phần mềm tự động (AMIS, Jira, Power BI, AI Marketing,...)
  • Nơi làm việc hạnh phúc: MISA mong muốn tạo một môi trường làm việc để bạn luôn cảm thấy hạnh phúc
Nộp đơn ứng tuyển
Tôi đồng ý với các điều khoản trong "Chính sách bảo vệ dữ liệu cá nhân dành cho ứng viên"
Nộp hồ sơ ngay
Thông tin liên hệ
Người liên hệ
icon
Bùi Mạnh Khương
Số điện thoại
Chào bạn,
Trợ lý AVA AI sẽ giúp trả lời câu hỏi của bạn
Image
Image
Chat với AVA AI
Nộp đơn
Zalo
MISA AVA
misa
Tư vấn bán hàng 0904 885 833 Hỗ trợ sau mua 19008177