Xử lý ảnh- Lời mở đầu

Xử lý ảnh là một ngành khoa học còn tương đối mới mẻ so với nhiều ngành khoa học khác. Hiện nay nó đang là một trong những lĩnh lực được quan tâm và đã trở thành môn học chuyên ngành của sinh viên hệ kỹ sư, cử nhân ngành Công nghệ Thông tin.

Nhờ có công nghệ số hóa hiện đại, ngày nay con người đã có thể xử lý tín hiệu nhiều chiều thông qua nhiều hệ thống khác nhau, từ những mạch số đơn giản cho đến những máy tính song song cao cấp. Mục tiêu của xử lý này có thể chia làm ba hướng như sau:

* Xử lý ảnh ban đầu để có được ảnh mới theo một yêu cầu xác định (ví dụ như ảnh mờ cần xử lý để được ảnh rõ hơn)

* Phân tích ảnh để thu được các thông tin đặc trưng giúp cho việc phân loại, nhận biết ảnh (ví dụ phân tích ảnh vân tay để trích chọn các đặc trưng vân tay)

* Hiểu ảnh đầu vào để có những mô tả về ảnh ở mức cao hơn, sâu hơn (ví dụ từ ảnh mộttai nạn giao thông phác họa hiện trường tai nạn).

Trong bài giảng này, chúng ta sẽ tập trung vào những khái niệm cơ bản của xử lý ảnh và giới hạn vấn đề trong phạm vi 2 – chiều

Từ đó, ta có các ứng dụng trong:

Sản xuất và kiểm tra chất lượng

Di chuyển của Robot

Các phương tiện đi lại tự trị

Công cụ hướng dẫn cho người mù

An ninh và giám sát

Nhận dạng đối tượng, nhận dạng mặt

Ứng dụng trong y học

Sản xuất, hiệu chỉnh Video

Chinh phục vũ trụ…

Vì những ứng dụng to lớn của công nghệ xử lý ảnh, chúng ta hãy bắt tay vào ngay từ bây giờ tìm hiểu, làm việc với một trong những thế giới đầy tiềm năng này.


Chương I

Tổng quan về hệ thống xử lý ảnh và các vấn đề trong xử lý ảnh

I. Ảnh và Hệ thống xử lý ảnh

1. Ảnh

– Tín hiệu ảnh thuộc loại tín hiệu đa chiều: tọa độ(x,y,z), độ sáng(l), thời gian(t).

– Ảnh(tĩnh) không gian 2 chiều được định nghĩa là một hàm 2 biến S(x,y), với S là giá trị biên độ(độ sáng) tại vị trí tọa độ (x,y).

+ Ảnh tương tự S(x,y):

Miền xác định (x,y) liên tục.

Miền giá trị S liên tục.

+ Ảnh số S(m,n) (ảnh tương tự được số hóa):

Miền xác định (m,n) rời rạc

Miền giá trị S rời rạc.

– Một ảnh(bao gồm một tập các điểm ảnh) có thể xem như bao gồm tập các ảnh con(các vùng ảnh). Thuật ngữ gọi là ROIs – vùng quan tâm(Regions of Interest).

– Ảnh số trong không gian rời rạc thu được từ ảnh tương tự trong không gian liên tục thông qua quá trình số hóa.

+ Ảnh tương tự được chia thành M hàng, N cột.

+ Giao của hàng và cột được gọi là: pixel

+ Giá trị biên độ của pixel tại tọa độ nguyên (m,n) là S(m,n): là trung bình độ sáng trong pixel đó. (L số mức xám dùng biểu diễn ảnh).

M, N thường được chọn là M=N=2K (K=8,9,10). L =2B , B là số bít mã hóa cho độ sáng(biên độ) mỗi pixel.

– Ảnh số được biểu diễn bởi ma trận 2 chiều. Các phần tử của nó là biểu diễn cho các pixel số hóa.

– Ta ký hiệu 1 ảnh số là S(M,N). Ta nói ảnh có độ phân giải MxN. Ký hiệu S(m,n) để chỉ ra một phần tử ảnh.

Hình 1.1 : Ảnh tương tự và Ảnh số hóa

2. Hệ thống xử lý ảnh

– Xử lý ảnh: Ảnh vào ® Ảnh kết quả.

– Đối tượng xử lý của hệ thống ở đây là các hàm 2 biến liên tục hoặc rời rạc.

– Có thể tóm tắt hệ thống xử lý ảnh gồm các giai đoạn chính như sau:

Hình 1.2 Các giai đoạn chính trong hệ thống xử lý ảnh

+ Thu nhận ảnh: – Qua các camera (tương tự, số).

– Từ vệ tinh qua các bộ cảm ứng (Sensors).

– Qua các máy quét ảnh (Scaners).

+ Số hóa ảnh: Biến đổi ảnh tương tự thành ảnh rời rạc để xử lý bằng máy tính: Thông qua quá trình lấy mẫu (rời rạc về mặt không gian) và lượng tử hóa(rời rạc về mặt biên độ).

+ Xử lý số: là một tiến trình gồm nhiều công đoạn nhỏ: Tăng cường ảnh (Enhancement), khôi phục ảnh (Restoration), phát hiện biên (Egde Detection), phân vùng ảnh (Segmentation), trích chọn các đặc tính (Feature Extraction)…

+ Hệ quyết định: Tùy mục đích của ứng dụng mà chuyển sang giai đoạn khác là hiển thị, nhận dạng, phân lớp, truyền thông…

II. Các vấn đề cơ bản trong xử lý ảnh

1. Biểu diễn và mô hình hóa ảnh

ü Biểu diễn ảnh

Ảnh có thể xem là một hàm 2 biến chứa các thông tin như biểu diễn của một ảnh. Các mô hình biểu diễn ảnh cho ta một mô tả logic hay định lượng của hàm này. Dựa vào phần tử đặc trưng của ảnh đó là pixel. Giá trị pixel có thể là một giá trị vô hướng, hoặc là 1 vector(3 thành phần trong trường hợp ảnh màu).

Ta có thể biểu diễn ảnh bằng hàm toán học, hoặc các ma trận điểm. Trong mô hình toán học, ảnh hai chiều được biểu diễn nhờ các hàm hai biến. Đó là

với

ü Biểu diễn bằng hàm toán

S: ảnh

(m,n): Tọa độ của Pixel trong miền không gian (2D)

S(m,n): Độ sáng (Mức xám) của pixel (m,n).

[0-Lmax]: Thang mức xám – Vùng các mức xám được phép sử dụng. Lmax thường là 255, nghĩa là chúng ta sử dụng thang mức xám 8 bit.

Với , ta gọi đó là ảnh số M x N

ü Biểu diễn bằng ma trận điểm:

Hình 1.3 a, Ảnh thật 10×10; b, Ảnh được zoom; c, Mô tả ảnh bằng ma trận điểm

ü Mô hình hóa ảnh

Mô hình cảm nhận ảnh: Là mô hình biểu diễn thông qua các thuộc tính cảm nhận ảnh(màu sắc, cường độ sáng), các thuộc tính về thời gian, các cảm nhận về phối cảnh, bố cục.

Mô hình cục bộ: Là mô hình biểu diễn thể hiện mối tương quan cục bộ của các phần tử ảnh (ứng dụng cho các bài toán xử lý và nâng cao chất lượng ảnh).

Mô hính tổng thể: Là mô hình biểu diễn ảnh xem ảnh như là một tập hợp các đối tượng, và các đối tượng này có mối quan hệ không gian với nhau (ứng dụng cho các bài toán phân nhóm và nhận dạng ảnh).

2. Tăng cường ảnh

ü Mục đích: Tăng cường các thuộc tính cảm nhận, làm cho ảnh tốt lên theo một ý nghĩa nào đó, tiện phục vụ cho các xử lý tiếp theo.

ü Các thao tác:

– Thay đổi độ tương phản, thay đổi màu sắc, cường độ sáng, lọc nhiễu, nội suy, làm trơn ảnh.

ü Các phương pháp chính:

Các phương pháp thao tác trên điểm (Point Operation)

Các thao tác không gian (Spatial Operation)

3. Khôi phục ảnh

Hệ thống thu nhận ảnh

Ảnh đầu ra

Ảnh đầu vào

ü Mục đích: Khôi phục lại ảnh ban đầu, loại bỏ các biến dạng ra khỏi ảnh tùy theo nguyên nhân gây ra biến dạng.

hàm biểu diễn nhiễu cộng.

hàm biểu diễn đối tượng.

ảnh thu nhận.

đáp ứng của hệ thống, còn gọi là hàm tán xạ điểm (Point Spread Function- PSF).

Một vấn đề khôi phục ảnh tiêu biểu là tìm một xấp xỉ của khi PSF có thể đo lường hay quan sát được, ảnh mờ và các tính chất sác xuất của quá trình nhiễu.

ü Các thao tác: lọc nhiễu, giảm độ méo,…

ü Các phương pháp: lọc ngược, lọc thích nghi(Wiener), khôi phục ảnh từ các hình chiếu.

4. Biến đổi ảnh

ü Mục đích: Biến đổi thể hiện của ảnh dưới các góc nhìn khác nhau tiến cho việc xử lý, phân tích ảnh.

ü Các phương pháp: Biến đổi Fourier, Sin, Cosin, KL, …

5. Phân tích ảnh

ü Mục đích: Tìm ra các đặc trưng của ảnh, xây dựng quan hệ giữa chúng dựa vào các đặc trưng cục bộ.

ü Các thao tác: Tìm biên, tách biên, làm mảnh đường biên, phân vùng ảnh, phân loại đối tượng.

ü Các phương pháp: Phương pháp phát hiện biên cục bộ, dò biên theo qui hoạch động, phân vùng theo miền đồng nhất, phân vùng dựa theo đường biên…

6. Nén ảnh

ü Mục đích: giảm không gian lưu trữ, thuận tiện truyền thông trên mạng.

ü Phương pháp: nén không mất thông tin, nén mất thông tin

+ Nén không mất thông tin (nén chính xác): khai thác các thông tin dư thừa.

+ Nén mất thông tin: khai thác các thông tin dư thừa và các thông tin không liên quan.

– Hiện nay có một số chuẩn nén hay dùng: JPEG, MPEG (JPEG-2000, MPEG-4)

7. Nhận dạng

Nhận dạng ảnh là quá trình liên quan đến mô tả đối tượng mà người ta muốn đặc tả nó. Thường đi sau quá trình trích chọn các đặc tính của đối tượng.

Có 2 kiểu mô tả đối tượng:

+ Mô tả theo tham số (nhận dạng theo tham số).

+ Mô tả theo cấu trúc (nhận dạng theo cấu trúc).

ü Ứng dụng: nhận dạng đối tượng, mặt, vân tay, văn bản…

– Nhận dạng chữ in hoặc đánh máy phục vụ cho việc tự động hóa việc đọc tài liệu, tăng nhanh tốc độ và chất lượng thu nhận thông tin từ máy tính.

– Nhận dạng chữ viết tay (với một số ràng buộc)

ü Mạng nơron là một kỹ thuật mới đang được áp dụng vào nhận dạng và cho kết quả khả quan.

III. Một số quan hệ cơ bản giữa các pixel

– Gọi f(x,y) là ảnh số, p, q là các điểm ảnh, S là một tập con các điểm ảnh.

1. Quan hệ láng giềng (neighborhood)

Cho điểm ảnh p(x,y)

– Các láng giềng theo hướng đứng, ngang N4(p): (x+1,y), (x-1,y), (x,y+1), (x,y-1)

– Các láng giềng theo hướng chéo ND(p): (x+1,y+1), (x+1,y-1), (x-1,y+1), (x-1,y-1)

– Các láng giềng theo 8 hướng N8(p): N4(p) + ND(p)

N4(p) ND(p) N8(p)

2. Quan hệ liên thông (Conectivity)

– Quan hệ liên thông giữa 2 pixel là quan trọng bởi vì: nó được sử dụng để thiết lập các đường biên của đối tượng và các thành phần của các vùng ảnh.

– Hai pixel là có quan hệ liên thông với nhau nếu:

+ Chúng là láng giềng của nhau

+ Các giá trị xám của chúng thỏa mãn tiêu chuẩn nhất định về sự tương đồng.

Với , thì tập các pixel trong S có liên thông với p thì được gọi là một thành phần liên thông của S.

– Nếu S chỉ có 1 thành phần liên thông, thì S được gọi là 1 tập liên thông.

3. Quan hệ lân cận (Adjacency

)

ü Gọi V là tập các giá trị xám dùng để định nghĩa lân cận. Ví dụ là một tập định nghĩa cho lân cận của các pixel có giá trị 1.

4-Adjacency: 2 pixel p,q4-Adjacency nếu

8-Adjacency: 2 pixel p,q8-Adjacency nếu

m-Adjacency: 2 pixel p,q là m-Adjacency nếu:

+ hoặc

m-Adjacency là sự cải tiến của 8-Adjacency, nhằm loại bỏ bớt các đường liên kết kép thường gặp phải khi ta dùng 8-Adjacency.

ü 2 ảnh con S1, S2 được gọi là lân cận nhau nếu: một số pixel trong S1 là lân cận của một số pixel trong S2

6. Khoảng cách giữa các pixel (Distance Measures)

Cho p(x,y), q(s,t), z(u,v). D là hàm xác định khoảng cách.

+ D(p,q) 0 (D(p,q)=0 nếu p=q)

+ D(p,q) = D(q,p)

+ D(p,z) D(p,q) + D(q,z)

ü Khoảng cách Euclidean (De Distance)

– Các điểm có khoảng cách Euclidean nhỏ hơn hoặc bằng r kể từ (x,y) là nằm trong đường tròn bán kính r tâm tại (x,y).

ü City-Block Distance (D4 Distance)

– D4(p,q) = |x-s| + |y-t|

Ví dụ: Tập các pixel với D4

kể từ p(x,y):

ü ChessBoard Distance (D4 Distance)

– D8(p,q) = max(|x-s|,|y-t|)

Ví dụ: Tập các pixel với D8

kể từ p(x,y):

Rõ ràng là D4, D8 là độc lập với bất cứ các đường (path) tồn tại nối giữa các điểm. Bởi vì việc tính khoảng cách này ta chỉ quan tâm tới tọa độ của các điểm (không chú ý đến việc có tồn tại các đường liên thông giữa chúng hay không).

IV. Các mô hình màu

Dải phổ điện từ (Electromagnetic (EM)) Spectrum

Mô hình màu

Là phương pháp diễn giải các đặc tính và tác động của màu trong ngữ cảnh nhất định. Không có mô hình màu nào là đầy đủ cho mọi khía cạnh của màu Người ta sử dụng các mô hình màu khác nhau để mô tả các tính chất được nhận biết khác nhau của màu.

Thí dụ:

+ Mô hình màu RGB: ánh sáng Red, Green và Blue ứng dụng cho màn hình, TV.

+ Mô hình HSV: Nhận thức của con người.

+ Mô hình CYK: Máy in.

II.1 Màu cơ sở và biểu đồ màu CIE

Năm 1931: CIE (Commision Internationale de l’Éclairage) xây dựng màu cơ sở chuẩn quốc tế:

· Cho phép các màu khác được định nghĩa như tổng trọng lượng của ba màu cơ sở.

· Do không tồn tại 3 màu cơ sở chuẩn trong phổ nhìn thấy để tổng hợp màu mới -> CIE sử dụng các màu tưởng tượng.

· Mỗi màu cơ sở trong CIE được xác định bằng đường cong phân bổ năng lượng.

· Nếu A, B, C là tổng số các màu cơ sở chuẩn cần xác định màu cho trước trong phổ nhìn thấy thì các thành phần của màu sẽ là:


·

Nhưng x+y+z=1 cho nên chỉ cần 2 giá trị có thể xác định màu mới

· Cho khả năng biểu diễn mọi màu trên biểu đồ 2D -> Biểu đồ CIE

Biểu đồ CIE

· Khi vẽ các giá trị x, y của màu trong phổ nhìn thấy -> Biểu đồ CIE là đường cong hình lưỡi (còn gọi là biểu đồ kết tủa – CIE Chromaticity Diagram)

· Các điểm màu gán nhãn trên đường cong từ violet (400 nm) đến red (700 nm)

· Điểm C tương ứng màu trắng (ánh sáng ban ngày)

· Biểu đồ CIE là phương tiện lượng hóa độ tinh khiết và bước sóng trội:

· Độ tinh khiết của điểm màu C1: được xác định bằng khoảng cách tương đối của đoạn thẳng nối C với đường cong qua C1

.

· Màu bù: biểu diễn bởi 2 điểm cuối C3, C4 của đoạn thẳng đi qua C.

· Gam màu xác định bởi 2 điểm: biểu diễn bởi đoạn thẳng nối hai điểm màu C5, C6

.

· Gam màu xác định bởi 3 điểm: ba điểm C7, C8, C9 chỉ xác định màu trong tam giác.

C

C2

C1

C3

C4

C5

C6

C7

C9

C8

Hình vẽ biểu đồ màu CIE

· Ứng dụng biểu đồ CIE để so sánh gam màu các thiết bị ngoại vi. Máy in không thể in mọi màu hiển thị trên màn hình.

Quan niệm về màu trực giác

· Họa sỹ vẽ tranh màu bằng cách trộn các chất màu với chất màu trắng và chất màu đen để có shade, tint và tone khác nhau:bắt đầu từ màu tinh khiết, bổ sung đen để có bong (shade) màu. Nếu bổ sung chất màu trắng sẽ có tint khác nhau. Bổ sung cả chất màu trắng và đen sẽ có tone khác nhau.

· Cách biểu diễn này trực giác hơn mô tả màu bằng ba màu cơ sở. Các bộ chương trình đồ họa có cả hai mô hình màu: cho người sử dụng dễ tương tác với màu, các thành phần màu ứng dụng trên các thiết bị.

+ Để tiện biểu diễn, các không gian màu dưới đây đều được chuẩn hóa về 1.

II.2 Mô hình màu RGB

– Mọi màu được biểu diễn bởi không gian màu RGB đều là sự pha trộn của 3 thành phần màu cơ bản (Red, Green, Blue).

Mô hình màu RGB được biểu diễn bởi khối lập phương với các trục R, G, B.

Nhận xét

· Mô hình này không thể biểu diễn mọi màu trong phổ nhìn thấy

· Đủ cho các ứng dụng máy tính

· Màn hình máy tính và TV sử dụng mô hình này

· Được sử dụng rộng rãi nhất

· Đơn giản

@ Xám hóa ảnh màu RGB

mức xám = 0.299R + 0.587G + 0.114B

Hoặc mức xám = 0.333R + 0.333G + 0.333B

II.3 Mô hình màu CMY

-Gồm 3 thành phần màu cơ bản cyan, magenta, yellow. Là bù màu của không gian GRB.

Mối quan hệ giữa 2 không gian

C = 1.0 – R

M = 1.0 – G

Y = 1.0 – B

@ Phương pháp pha trộn màu trong cuộc sống

II.4. Mô hình màu CMYK

Là sự mở rộng mô hình màu CMK bằng cách thêm vào thành phần màu Black (K). Bởi vì với thành phần màu Black tinh khiết sẽ cho ta độ tương phản cao hơn.

Mối quan hệ CMY và CMYK

K = min(C, M, Y)

C = C – K

M = M – K

Y = Y – K

II.3 Mô hình màu HSV

· Thay vì chọn các phần tử RGB để có màu mong muốn, người ta chọn các tham số màu: Hue, Saturation và Value (HSV)

· Mô hình HSV suy diễn từ mô hình RGB: hãy quan sát hình hộp RGB theo đường chéo từ White đến Black (gốc) -> ta có hình lục giác, sử dụng làm đỉnh hình nón HSV.

HSV (or HSB) color space and HLS color space·

Hue: Bước sóng gốc của ánh sáng. Trong mô hình Hue được biểu diễn bằng góc từ 00 đến 3600

Value: Cường độ hay độ chói ánh sáng.

· Value có giá trị [0, 1], V=0 -> màu đen. Đỉnh lục giác có cường độ màu cực đại.

· Saturation: Thước đo độ tinh khiết ánh sáng gốc. S trong khoảng [0, 1]. Biểu diễn tỷ lệ độ tinh khiết của màu sẽ chọn với độ tinh khiết cực đại.

Nhận xét

· Mô hình HSV trực giác hơn mô hình RGB. Bắt đầu từ Hue (H cho trước và V=1, S=1). thay đổi S: Bổ sung hay bớt trắng, thay đổi V: Bổ sung hay bớt đen cho đến khi có màu mong muốn.

Theo webng.com

TỒNG QUAN VỀ XỬ LÝ ẢNH

Summary: CHƯƠNG 1

CHƯƠNG 1: TỒNG QUAN VỀ XỬ LÝ ẢNH

Xử lý ảnh là một trong những mảng quan trọng nhất trong kỹ thuật thị giác máy tính, là tiền đề cho nhiều nghiên cứu thuộc lĩnh vực này. Hai nhiệm vụ cơ bản của quá trình xử lý ảnh là nâng cao chất lượng thông tin hình ảnh và xử lý số liệu cung cấp cho các quá trình khác trong đó có việc ứng dụng thị giác vào điều khiển.

Đã có rất nhiều công trình nghiên cứu tại nhiều quốc gia từ năm 1920 đến nay về xử lý ảnh đã góp phần thúc đẩy tiến bộ trong lĩnh vực này lớn mạnh không ngừng [GS. TS. Nguyễn Kim Sách].

Quá trình bắt đầu từ việc thu nhận ảnh nguồn (từ các thiết bị thu nhận ảnh dạng số hoặc tương tự) gửi đến máy tính. Dữ liệu ảnh được lưu trữ ở định dạng phù hợp với quá trình xử lý. Người lập trình sẽ tác động các thuật toán tương ứng lên dữ liệu ảnh nhằm thay đổi cấu trúc ảnh phù hơp với các ứng dụng khác nhau.

1.1 Chuyển ảnh màu thành ảnh xám

Đơn vị tế bào của ảnh số là pixel. Tùy theo mỗi định dạng là ảnh màu hay ảnh xám mà từng pixel có thông số khác nhau. Đối với ảnh màu từng pixel sẽ mang thông tin của ba màu cơ bản tạo ra bản màu khả kiến là Đỏ (R), Xanh lá (G) và Xanh biển (B) [Thomas 1892]. Trong mỗi pixel của ảnh màu, ba màu cơ bản R, G và B được bố trí sát nhau và có cường độ sáng khác nhau. Thông thường, mổi màu cơ bản được biểu diễn bằng tám bit tương ứng 256 mức độ màu khác nhau. Như vậy mỗi pixel chúng ta sẽ có
28×3=22428×3=224 size 12{2 rSup { size 8{8×3} } =2 rSup { size 8{“24”} } } {} màu (khoảng 16.78 triệu màu). Đối với ảnh xám, thông thường mỗi pixel mang thông tin của 256 mức xám (tương ứng với tám bit) như vậy ảnh xám hoàn toàn có thể tái hiện đầy đủ cấu trúc của một ảnh màu tương ứng thông qua tám mặt phẳng bit theo độ xám.

Trong hầu hết quá trình xử lý ảnh, chúng ta chủ yếu chỉ quan tâm đến cấu trúc của ảnh và bỏ qua ảnh hưởng của yếu tố màu sắc. Do đó bước chuyển từ ảnh màu thành ảnh xám là một công đoạn phổ biến trong các quá trình xử lý ảnh vì nó làm tăng tốc độ xử lý là giảm mức độ phức tạp của các thuật toán trên ảnh.

Chúng ta có công thức chuyển các thông số giá trị màu của một pixel thành mức xám tương ứng như sau:

G=α.CR+β.CG+δ.CBG=α.CR+β.CG+δ.CB size 12{G=α “.” C rSub { size 8{R} } +β “.” C rSub { size 8{G} } +δ “.” C rSub { size 8{B} } } {}(1.1)

Trong đó các giá trị
CR,CGvàCBCR,CGvàCB size 12{C rSub { size 8{R} } ,C rSub { size 8{G}  }  ital “và”C rSub { size 8{B} } } {} lần lượt là các mức độ màu Đỏ, Xanh lá và Xanh biển của pixel màu. Các hệ số
α,β,vàδα,β,vàδ size 12{α,β, ital “và”δ} {}là các giá trị thay đổi tùy thuộc hệ màu. Trong luận văn sử dụng hai card thu nhận tín hiệu video hệ NTSC từ hai camera nên các hệ số sẽ là:
α=0.29890,β=0.58662,vàδ=0.11448α=0.29890,β=0.58662,vàδ=0.11448 size 12{α=0 “.” “29890”,β=0 “.” “58662”, ital “và”δ=0 “.” “11448”} {}. Do đó công thức (1.1) trở thành:

G
=
0

.
29890
.

C

R

+
0

.
58662
.

C

G

+
0

.
11448
.

C

B

G
=
0

.
29890
.

C

R

+
0

.
58662
.

C

G

+
0

.
11448
.

C

B

size 12{G=0 “.” “29890” “.” C rSub { size 8{R} } +0 “.” “58662” “.” C rSub { size 8{G} } +0 “.” “11448” “.” C rSub { size 8{B} } } {}

Chúng ta xem ảnh nguồn như một mảng hai chiều, duyệt qua từng pixel phần tử của mảng bằng công thức 1.1 chúng ta sẽ có được ảng xám kết quả như hình 1.2 sau:

Figure 1

Figure 2

Hình 1.2 Chuyển ảnh màu thành ảnh xám

1.2 Lược đồ xám của ảnh (Histogram)

Lược đồ xám của một ảnh số có các mức xám trong khoảng
[0,L−1][0,L−1] size 12{ \[ 0,L – 1 \] } {} là một hàm rời rạc
p(rk)=nk/np(rk)=nk/n size 12{p \( r rSub { size 8{k} }  \) =n rSub { size 8{k} } /n} {}. Trong đó
nknk size 12{n rSub { size 8{k} } } {} là số pixel có mức xám thứ
rkrk size 12{r rSub { size 8{k} } } {}, n là tổng số pixel trong ảnh và
k=0,1,2….L−1k=0,1,2….L−1 size 12{k=0,1,2 “.”  “.”  “.”  “.” L – 1} {}. Do đó
P(rk)P(rk) size 12{P \( r rSub { size 8{k} }  \) } {}cho một xấp xỉ xác suất xảy ra mức xám
rkrk size 12{r rSub { size 8{k} } } {}. Vẽ hàm này với tất cả các gia trị của
kk size 12{k} {} sẽ biểu diễn khái quát sự xuất hiện các mức xám của một ảnh. Chúng ta cũng có thể thề hiện lược đồ mức xám của ảnh thông qua tần suất xuất hiện mỗi mức xám qua hệ tọa độ vuông góc Oxy. Trong đó, trục hoành biểu diễn số mức xám từ 0 đến N (số bit của ảnh xám). Trục tung biểu diễn số pixel của mỗi mức xám.

Figure 3

Hình 1.3: Lược đồ xám của ảnh hình 1.2

1.3 Các bộ lọc không gian

Trong quá trình xử lý ảnh chúng ta có thể sử dụng các mặt nạ không gian nhằm làm thay đổi cấu trúc ảnh gọi là các bộ lọc không gian. Có hai loại lọc không gian là lọc không gian tuyến tính và lọc không gian phi tuyến.

1.3.1. Lọc tuyến tính

Lọc tuyến tính có các hàm dịch, hàm xung hoặc hàm phân tán điểm là các biến đổi Fourier ngược. Lọc thông thấp làm say giảm hoặc loại trừ các thành phần tần số cao trong miền Fourier và cho các tần số thấp đi qua. Các thành phần tần số cao đặc trưng cho các biên, các chi tiết làm nét trong ảnh, do đó hiệu quả của bộ lọc thông thấp là làm nhòe ảnh. Ngược lại với bộ lọc thông thấp, bộ lọc thông cao làm suy giảm các thành phần tần số thấp. Các thành phần này thể hiện qua các đặc trưng thay đổi chậm của ảnh như độ tương phản và cường độ sánh trung bình. Hiệu quả chung của các bộ lọc thông cao là làm rõ các biên và chi tiết. Ngoài ra còn có bộ lọc thông dãi nhằm giữ lại vùng tần số giữa thấp và cao. Nhiệm vụ chính của các bộ lọc này nhằm khôi phục ảnh, Một mặt nạ lọc tuyến tính 3×3 có đáp ứng như sau:

R
=

w

1

z

1

+

w

2

z

2

+
.

.
.

.
+

w

9

z

9

R
=

w

1

z

1

+

w

2

z

2

+
.

.
.

.
+

w

9

z

9

size 12{R=w rSub { size 8{1} } z rSub { size 8{1} } +w rSub { size 8{2} } z rSub { size 8{2} } + “.”  “.”  “.”  “.” +w rSub { size 8{9} } z rSub { size 8{9} } } {}

Figure 4
Trong đó
wiwi size 12{w rSub { size 8{i} } } {} là phần tử thứ
ii size 12{i} {}của mặt nạ và
zizi size 12{z rSub { size 8{i} } } {} là giá trị độ xám của một pixel được ô thứ
ii size 12{i} {}của mặt nạ chập lên.

Hình 1.4: Các vùng cơ bản của mạch lọc tuyến tính

1.3.2. Lọc phi tuyến

a. Bộ lọc Mean

Mạch lọc là một mặt nạ có kích thước
nxnnxn size 12{nxn} {}, trong đó tất cả các hệ số đều bằng 1. Đáp ứng là tổng các mức xám của
nxnnxn size 12{nxn} {}pixels chia cho
nxnnxn size 12{nxn} {}. Ví dụ mặt nạ 3×3 thì đáp ứng là tổng mức xám của 9 pixels chia cho 9.

1
1
1

1
1
1

1
1
1

1
9

×

1
9

×

size 12{ {  {1}  over  {9} }  times } {}

Nhân chập mặt nạ với tất cả các pixel của ảnh gốc chúng ta sẽ thu được ảnh kết quả qua bộ lọc Mean theo công thức sau:

f
[
i
,
j

]
=

1
S

k
,
l
:
N

s
(
k
,
l
)

f
[
i
,
j

]
=

1
S

k
,
l
:
N

s
(
k
,
l
)

size 12{f \[ i,j \] = {  {1}  over  {S} }  Sum cSub { size 8{k,l:N} }  {s \( k,l \) } } {}

Figure 5
Figure 6
Với
f[i,j]f[i,j] size 12{f \[ i,j \] } {} là giá trị pixel kết quả,
s(k,l)s(k,l) size 12{s \( k,l \) } {}là các giá trị pixel ảnh gốc được mặt nạ chập lên và S là kích thước mặt nạ.

Hình 1.5: Ảnh gốc và ảnh qua bộ lọc Mean

Bộ lọc Mean có vai trò làm trơn ảnh có thể xem như bộ lọc thông cao, nhưng lại làm mờ đường biên của các đối tượng bên trong ảnh, làm mất tín hiệu cận nhiễu và không lọc được nhiễu xung.

b. Bộ lọc Median

Để thực hiện lọc Median trong lân cận của một pixel chúng ta sắp xếp các giá trị của pixel và các lân cận, xác định trung vị Median và định giá trị pixel. Ví dụ như một lân cận 3×3 có các giá trị: 10, 20, 20, 20, 15, 20, 20, 25, 100. Các giá trị này được sắp xếp lại theo thứ tự từ thấp đến cao: 10, 15, 20, 20, 20, 20, 20, 25, 100. Giá trị median là 20. Do đó về nguyên lý thì mạch median có thể tách được các điểm có cường độ sáng lớn như nhiễu xung và lọc các điểm có cường độ sáng tức thì (xung) hay còn gọi là các nhiễu muối tiêu.

Figure 7

Figure 8

Hình 1.6: Ảnh gốc bị nhiễu muối tiêu và ảnh sau khi lọc Median

c. Bộ lọc Gauss

Về bản chất bộ lọc Gauss có phương thức tiến hành tương đồng với bộ lọc trung bình nhưng có thêm tác động của các trọng số. Các trọng số này được tính tỷ lệ với hàm Gauss theo khoảng cách tới điểm tính toán. Công thức tính giá trị cho từng pixel ảnh gốc theo lọc Gauss như sau:

g
(
i
,
j

)
=

1
N

m
,
n
:
K

G
(

i

m

,

j

n

)
×
f

(
m
,
n
)

g
(
i
,
j

)
=

1
N

m
,
n
:
K

G
(

i

m

,

j

n

)
×
f

(
m
,
n
)

size 12{g \( i,j \) = {  {1}  over  {N} }  Sum cSub { size 8{m,n:K} }  {G \( i – m,j – n \)  times f \( m,n \) } } {}

Trong đó
g(i,j)g(i,j) size 12{g \( i,j \) } {}là giá trị độ xám pixel kết quả, N là kích thước cửa sổ,
f(m,n)f(m,n) size 12{f \( m,n \) } {} là giá trị độ xám của pixel đang tác động,
G(i−m,j−n)G(i−m,j−n) size 12{G \( i – m,j – n \) } {} là các trọng số. Các trọng số được tính toán tỷ lệ theo hàm Gauss bằng khoảng cách tới điểm tính toán.

G
(
x
,
y

)
=

1

2

πσ

2

e

x

2

+

y

2

2

G
(
x
,
y

)
=

1

2

πσ

2

e

x

2

+

y

2

2

size 12{G \( x,y \) = {  {1}  over  {2 ital “πσ” rSup { size 8{2} } } } e rSup { size 8{ –  {  {x rSup { size 6{2} } +y rSup { size 6{2} } }  over  {2σ rSup { size 6{2} } } } } } } {}

2    7    12    7    2
7    31    52    31    7
15    52    127    52    15
7    31    52    31    7
2    7    12    7    2
14231423 size 12{ {  {1}  over  {“423″} } } {}x

Thực hiện phép nhân chập giữa mặt nạ Gauss và ảnh gốc chúng ta thu được ảnh kết quả được xử lý bằng mạch lọc Gauss. Vai trò của bộ lọc Gauss cũng làm trơn ảnh như bộ lọc trung bình, tuy nhiên bộ lọc Gauss cho chất lượng ành kết quả cao hơn vì có sự tập trung trong số vào pixel đang xét tại vị trí trung tâm.

Figure 9

Figure 10

Hình 1.7: Ảnh gốc và ảnh xử lý bằng bộ lọc Gauss.

1.4. Tách biên đối tượng

Ảnh thu được từ các thiết bị ghi nhận sau khi qua bước tiền xừ lý sẽ đến quá trình phân tích ảnh. Có nhiều phương pháp phân tích ảnh trong đó tách biên đối tượng là một công cụ mạnh. Vai trò của tách biên chủ yếu là trích đặc trưng đối tượng theo đường biên ảnh và phân vùng ảnh dựa trên đường biên.

1.4.1 Phương pháp Canny

Là một phương pháp tách biên ảnh do Francis Canny tìm ra tại phòng thí nghiệm ảnh thuộc MIT. Quá trình tiến hành thuật toán trải qua một số bước như sau:

1. Làm trơn ảnh bằng bộ lọc Gauss nhằm giảm thiểu ảnh hưởng của nhiễu và các chi tiết không mong nuôn trong cấu trúc ảnh.
2. Tính gradient của ảnh nhờ một trong các toán tử:Roberts, Sobel hay Prewitt…

M
(
j
,
j

)
=

g

i

2

(
i
,
j

)
+

g

j

2

(
i
,
j
)

M
(
j
,
j

)
=

g

i

2

(
i
,
j

)
+

g

j

2

(
i
,
j
)

size 12{M \( j,j \) = sqrt {g rSub { size 8{i} }  rSup { size 8{2} }  \( i,j \) +g rSub { size 8{j} }  rSup { size 8{2} }  \( i,j \) } } {}


θ(i,j)=tan−1[gj(i,j).gi(i,j)]θ(i,j)=tan−1[gj(i,j).gi(i,j)] size 12{θ \( i,j \) =”tan” rSup { size 8{ – 1} }  \[ g rSub { size 8{j} }  \( i,j \)  “.” g rSub { size 8{i} }  \( i,j \)  \] } {}

1. Xác định ngưỡng

M

T

(
i
,
j

)
=

{

M
(
i
,
j
)

Nêu

M
(
i
,
j

)
>
T

0

Khác

M

T

(
i
,
j

)
=

{

M
(
i
,
j
)

Nêu

M
(
i
,
j

)
>
T

0

Khác

size 12{M rSub { size 8{T} }  \( i,j \) = left lbrace  matrix {
M \( i,j \)  ital “Nêu”M \( i,j \) >T {} ##
0 ital “Khác”
}  right none } {}

Với T được chọn là các phần tử cạnh.

1. Dựa vào hướng của dradient để loại bỏ những điểm không thực sự là biên. Chúng ta kiểm tra các điểm
MT(i,j)MT(i,j) size 12{M rSub { size 8{T} }  \( i,j \) } {}nếu có giá trị lớn hơn hai điểm lân cận dọc theo phương gradient
θ(i,j)θ(i,j) size 12{θ \( i,j \) } {} thì giữ nguyên và ngược lại thì gán giá trị bằng 0.
2. Dùng ngưỡng kép
τ1τ1 size 12{τ rSub { size 8{1} } } {} và
τ2τ2 size 12{τ rSub { size 8{2} } } {} (
τ1τ1 size 12{τ rSub { size 8{1} } } {} <
τ2τ2 size 12{τ rSub { size 8{2} } } {}) tạo ra các điểm trung gian nhằm nối liến các điểm biên đã xác định được từ trước theo phương thức sau:

Những điểm
M(i,j)M(i,j) size 12{M \( i,j \) } {} có giá trị gradient lớn hơn
τ2τ2 size 12{τ rSub { size 8{2} } } {} thì được xem là điểm biên. Những điểm
M(i,j)M(i,j) size 12{M \( i,j \) } {} có giá trị gradient nhỏ hơn
τ1τ1 size 12{τ rSub { size 8{1} } } {} thì loại bỏ. vối những điểm có giá trị gradient nằm trong khoảng
τ1τ1 size 12{τ rSub { size 8{1} } } {} và
τ2τ2 size 12{τ rSub { size 8{2} } } {} thì kiểm tra thêm nếu nó liền kề với một điểm có gradient lớn hơn
τ1τ1 size 12{τ rSub { size 8{1} } } {} thì điểm này được xem là điểm biên. Kết quả chúng ta sẽ thu được các đường biên tạo từ vô số các điểm biên liền kề liên tục.

Figure 11

(a)

Figure 12

(b)

Figure 13

(c)

Hình 1.8: (a) Ảnh gốc; (b) Lọc Canny với ngưỡng 0 – 150; (c) Lọc Canny với ngưỡng 200 – 255.

Theo vocw.edu.vn