Xử lý và nâng cao chất lượng ảnh


Nâng cao chất lượng ảnh là một bước quan trọng tạo tiền đề cho xử lý ảnh.

ü Mục đích: làm nổi bật một số đặc tính của ảnh: Thay đổi độ tương phản, lọc nhiễu, nổi biên, làm trơn biên, khuếch đại ảnh…

Tăng cường ảnh: Nhằm hoàn thiện trạng thái quan sát của một ảnh. Bao gồm điều khiển mức xám, thay đổi độ tương phản, giảm nhiễu, làm trơn, nội suy…

Khôi phục ảnh: Nhằm khôi phục ảnh gần với trạng thái thực nhất trước khi biến dạng, tùy theo nguyên nhân gây ra biến dạng.

ü Các phương pháp thực hiện:

Thực hiện trên miền không gian

+ Toán tử điểm (Point Operations): giá trị 1 điểm ảnh đầu ra phụ thuộc duy nhất vào 1 giá trị đầu vào tại vị trí tương ứng trên ảnh vào.

+ Toán tử cục bộ (Local Operations): giá trị một điểm ảnh đầu ra phụ thuộc vào giá trị của chính nó và các lân cận của nó trong ảnh vào.

Thực hiện trên miền tần số

+ Toán tử tổng thể (Global Operations): giá trị của 1 điểm ảnh đầu ra phụ thuộc vào tất cả giá trị các điểm ảnh trong ảnh vào

I. Tăng cường ảnh

I.1. Các thao tác trên miền không gian (Spatial Operations)

– Là hàm thao tác trực tiếp trên tập các điểm ảnh.

– Biểu diễn công thức tổng quát như sau:

– Một láng giềng (Neighborhood) của (m,n) được định nghĩa bởi việc sử dụng một ảnh con (subimage) hình vuông, hình chữ nhật hoặc bát giác, có tâm điểm tại (m,n).

Hình 5.1. Một số dạng lân cận

– Khi láng giềng là 1×1, thì hàm T trở thành hàm biến đổi hay ánh xạ mức xám (gray level transformation function).

v = T[s]

s, v là các mức xám của S(m,n) V(m,n).

1. Các kỹ thuật tăng cường ảnh sử dụng toán tử điểm

Xử lý điểm ảnh là 1 trong các phép xử lý cơ bản và đơn giản. Có 2 cách tiếp cận trong cách xử lý này:

+ Dùng 1 hàm thích hợp (hàm tuyến tính hay hàm phi tuyến) tùy theo mục đích cải thiện ảnh để biến đổi giá trị của điểm ảnh (mức xám, độ sáng) sang một giá trị khác (mức xám mới).

+ Dựa vào kỹ thuật biến đổi lược đồ xám (Histogram).

(i). Tăng độ tương phản

ü Trước tiên cần làm rõ khái niệm độ tương phản. Ảnh số là tập hợp các điểm, mà mỗi điểm có giá trị sáng khác nhau. Ở đây, độ sáng để mắt người dễ cảm nhận ảnh song không phải là quyết định. Thực tế chỉ ra rằng hai đối tượng có cùng độ sáng nhưng đặt trên hai nền khác nhau sẽ cho cảm nhận khác nhau. Như vậy, độ tương phản biểu diễn sự thay đổi độ sáng của đối tượng so với nền. Một cách nôm na, độ tương phản là độ nổi của điểm ảnh hay vùng ảnh so với nền. Với khái niệm này, nếu ảnh của ta có độ tương phản kém, ta có thể thay đổi tuỳ theo ý muốn.

Hình 5.2. Các hình vuông con cùng 1 mức xám xuất hiện trên các nền khác nhau

s

v

a b L

vb

va

L

a

b

g

ü Nguyên lý: Điều chỉnh lại biên độ trên toàn dải hay dải có giới hạn bằng cách biến đổi tuyến tính (T là hàm tuyến tính) hay phi tuyến biên độ đầu vào.

+ Cách biến đổi tuyến tính:

với các độ dốc xác định độ tương phản tương đối, L là số mức xám tối đa của ảnh. Biểu diễn dưới dạng đồ thị ta có:

Dễ dàng thấy rằng:

+ : ảnh kết quả trùng với ảnh gốc.

+ : giãn độ tương phản

+ : co độ tương phản

Việc chọn phải phù hợp, sao cho với thì

ví dụ:

giả sử chọn:

tính được:

s

10

20

22

23

24

26

27

30

100

120

130

160

170

180

190

200

v

5

85

101

109

117

133

141

165

200

210

215

230

235

240

245

250

+ Cách biến đổi phi tuyến: trong trường hợp biến đổi phi tuyến, người ta sử dụng các hàm mũ hay hàm log dạng: , , là hằng số hiệu chỉnh và .

s

v

a b L

L

(ii). Tách nhiễu và phân ngưỡng

ü Tách nhiễu Là trường hợp đặc biệt của phân ngưỡng khi các độ dốc .

Ứng dụng để quan sát ảnh, cắt ảnh hoặc giảm nhiễu khi biết tín hiệu đầu vào nằm trên khoảng .

Đồ thị minh họa:

s

v

aº b L

vb

va

L

ü Phân ngưỡng (Thresholding)

Là trường hợp đặc biệt của tách nhiễu khi

Ứng dụng tạo các ảnh nhị phân, In ảnh 2 màu, vì ảnh gần nhị phân không thể cho ra ảnh nhị phân khi quét ảnh bởi có sự xuất hiện của nhiễu do bộ cảm biến và sự biến đổi của nền. Thí dụ trường hợp ảnh vân tay.

s

v

L

vb

va

L

Đồ thị minh họa:

(ii). Biến đổi âm bản (Digital Negative)

Biến đổi âm bản nhận được khi dùng phép biến đổi . Ứng dụng khi hiện các ảnh y học và trong quá tròng tạo các ảnh âm bản

(iii). Cắt theo mức (Intensity Level Slicing)

Làm nổi bật một miền mức xám nhất định (để tăng cường một số đặc điểm nào đó).

Có 2 kỹ thuật thực hiện:

+ Hiển thị giá trị cao cho tất cả các mức xám trong vùng quan tâm, và ngược lại (không nền).

+ Làm sáng vùng mức xám mong muốn, nhưng giữ nguyên các giá trị xám khác (có nền).

üKhông nền:

ü Có nền:

(iv). Trích chọn bít (Bit Plane Slicing)

ü Mục đích là để làm nổi bật các thành phần trên toàn ảnh bởi việc sử dụng các bít đặc biệt.

Mỗi mức xám của 1 điểm ảnh được mã hóa trên B bít, và được biểu diễn:

Trong các bít mã hóa, người ta chia làm 2 loại: bít bậc thấp và bít bậc cao. Với bít bậc cao, độ bảo toàn thông tin cao hơn nhiều so với bít bậc thấp. Các bít bậc thấp thường biểu diễn nhiễu hay nền.

Muốn trích chọn bít thứ n và hiện chúng, ta dùng biến đổi:

(v). Các toán tử logic và đại số

ü Sử dụng toán tử logic: Ứng dụng đối với các ảnh nhị phân NOT, AND, OR, XOR, NOT_AND…

üSử dụng toán tử đại số: Cộng, Trừ, Nhân…

– Trừ ảnh: mục đích tìm ra sự khác nhau của ảnh khi quan sát ảnh ở 2 thời điểm khác nhau. Sử dụng biến đổi

– Kỹ thuật này được dùng trong dự báo thời tiết, trong y học.

(vi). Mô hình hóa và biến đổi lược đồ xám

ü Lược đồ xám: là một hàm rời rạc cung cấp tần suất xuất hiện của mỗi mức xám.

+ sk là mức xám thứ k

+ nk là số các điểm ảnh khác có cùng mức xám sk

+ n là tổng số các điểm ảnh trong ảnh

– Biểu diễn lược đồ xám:

+ Trục tung biểu diễn số điểm ảnh cho một mức xám (hoặc tỷ lệ số điểm ảnh có cùng mức xám trên tổng số điểm ảnh)

+ Trục hoành biễu diễn các mức xám

Ví dụ:

# Phương pháp giãn lược đồ xám (Histogram Stretching )

– Thường thì trong một số ảnh, các giá trị xám không phủ đều trên toàn dải động sẵn có của ảnh, mà chỉ tập trung ở một số mức xám nhất định (tồn tại nhiều giá trị xám =0, hoặc là 2B-1). Điều này làm cho ảnh quá tối, quá sáng hoặc tương phản kém.

h(sk)

sk

ảnh tối

h(sk)

sk

ảnh sáng

h(sk)

sk

ảnh tương phản thấp

h(sk)

sk

ảnh tương phản cao

Để giải quyết điều này, ta thực hiện thao tác giãn lược đồ xám lên toàn dải động của ảnh.

Giả sử dải động (dải độ sáng ) của ảnh là , thì: thao tác này là một ánh xạ sao cho:

Giá trị xám nhỏ nhất của ảnh giá trị 0

Giá trị xám lớn nhất của ảnh giá trị 2B1

Ánh xạ này là: hoặc

# Phương pháp san bằng lược đồ xám (Histogram Equalization)

h(sk)

sk

a b Max

h(sk)

sk

a b Max

Ảnh gốc

Ảnh sau khi san bằng

Mục đích của phương pháp này là cố gắng chuyển lược đồ xám của ảnh về gần với 1 lược đồ định trước.

Thuật toán san bằng:

+ Khởi tạo H

for (i=0; i<256; i++) H[i] = 0 ;

+ Tính H

for (i=0; i<M; i++)

for (j=0; j<N; j++) H[Im[i][j]]++

+ Tính tỉ lệ xuất hiện mức xám I trên ảnh

for (i=0; i<256; i++) Hr[i] = H[i] / (M*N) ;

+ Tính phân phối xác suất mức xám k trên ảnh

Tong=0;

for (k=0; k<255; k++) { Tong+= Hr[k] ; HC[k] = Tong}

+ San bằng

for (i=0; i<M; i++)

for (j=0; j<N; j++) ImEq[i][j] = 255 * HC[Im[i][j]] ;

{@Hàm phân phối xác suất P(a) là khả năng xuất hiện các mức xám trong ảnh bé hơn hoặc bằng mức xám a}

Ví dụ

Cân bằng histogram của ảnh S

Xác định tần số mức xám

mức xám 10 20 30 40 50 60 70

 

tần số 3 4 5 3 3 3 4

;

Áp dụng ImEq[i,j]=255*Hc[Im[i,j]] và làm tròn số liệu ta có

Mức xám sin

10

20

30

40

50

60

70

Thay thế bởi sout

31

72

122

153

184

214

255

I.2. Kỹ thuật tăng cường ảnh sử dụng các toán tử cục bộ (miền không gian) -Kỹ thuật lọc số miền không gian

– Nhiễu gây cho ta những khó khăn khi phân tích tín hiệu. Trong khi các kỹ thuật trên rõ ràng là chưa đáp ứng được vấn đề giảm nhiễu. Vì vậy, kỹ thuật lọc số miền không gian được ứng dụng.

– Cơ sở lý thuyết của lọc số là dựa trên tính dư thừa thông tin không gian.

– Trong kỹ thuật này, người ta sử dụng một mặt nạ và di chuyển khắp ảnh gốc. Tùy theo cách tổ hợp điểm đang xét với các điểm lân cận mà ta có kỹ thuật lọc tuyến tính hay phi tuyến. Điểm ảnh chịu tác động của biến đổi là điểm ở tâm mặt nạ.

I.2.1. Kỹ thuật lọc tuyến tính (Linear Filter)

(i) Lọc trung bình không gian

– Mục đích: san bằng ảnh, làm mịn ảnh, loại bỏ các thành phần nhiễu muối, tiêu.

– Ý tưởng: mỗi điểm ảnh được thay thế bằng tổng trọng số hay trung bình trọng số của các điểm lân cận với với mặt nạ.

– Công thức toán học biểu diễn như sau:

, M*N là số lẻ.

W: cửa sổ lọc, là các trọng số của bộ lọc.

Trên là công thức tính tổng chập, vậy đây chính là việc nhân chập ảnh với mặt nạ lọc ảnh.

Thực tế ta thường dùng mặt nạ ,

Nói chung, người ta sử dụng nhiều kiểu mặt nạ khác nhau.

, ,

Ví dụ: Dùng mặt nạ H1

=63

(ii). Lọc thông thấp không gian (Spacial Low- Pass Filter).

– Mục đích: Khử nhiễu cộng và nội suy ảnh

– Trong lỹ thuật này, hay dùng một số mặt nạ sau:

,

(iii). Lọc đồng hình (Homomorphie Filter)

– Mục đích: khử nhiễu nhân.

– Kỹ thuật này thực hiện lấy logarit của ảnh quan sát: . Sau đó dùng phép biến đổi hàm e mũ để chuyển về ảnh cũ.

I.2.2. Kỹ thuật lọc phi tuyến (NonLinear Filter)

(i). Lọc trung vị (Median Filter)

– Được sử dụng chủ yếu cho giảm nhiễu

– Một bộ lọc trung vị cũng dựa vào việc dùng một cửa số di chuyển trên ảnh, và giá trị xám pixel đầu ra được thay thế bởi trung vị của các pixel trong cửa sổ đó.

– Thuật toán:

+ Các pixel trong cửa sổ sẽ được sắp xếp từ nhỏ tới lớn.

+ Nếu kích thước của cửa sổ =JxK là lẻ thì vị trí trung vị là , ngược lại thì vị trí trung vị là .

20 30 30 30 40 50 70 100 200

 

Ví dụ:

Dùng cửa sổ 3×3 ta có.

(ii) Bọ lọc giữ biên (Kuwahara Filter)

– Biên đóng vai trò quan trọng trong cảm nhận ảnh của chúng ta và trong phân tích ảnh. Bằng cách nào đó ta làm trơn ảnh mà không làm mất đi độ sắc nét của biên, nếu có thể thì không làm thay đổi vị trí của biên.

– Bộ lọc đạt được mục đích này gọi là bộ lọc “giữ biên”.

– Bộ lọc này cũng sử dụng một cửa sổ:

Pixel trung tâm

Vùng 1

Vùng 2

Vùng 3

Vùng 4

+ kích thước J=K=4L+1, L nguyên.

+ Chia của sổ thành 4 vùng( như mô tả)

+ Trong mỗi vùng ta tính trung bình độ sáng

và bình phương độ lệch chuẩn

=

+ Giá trị đầu ra của pixel trung tâm trong cửa sổ là giá trị trung bình của vùng có bình phương độ lệch chuẩn nhỏ nhất.

L là số điểm ảnh của vùng Â

(ii). Lọc thông cao, thông dải (Spacial High- pass, Band -pass Filter)

– Mục đích: làm trơn ảnh và trích chọn biên.

– Nếu ta có bộ lọc thông thấp không gian là , thì bộ lọc thông cao được định nghĩa , và bộ lọc thông dải là

– Dưới đây là cac mặt nạ hay dùng cho lọc thông cao.

, ,

I.3. Các thao tác trên miền tần số

Kỹ thuật này không thao tác trên một vùng ảnh mà là toàn bộ ảnh.

– Ý tưởng: Biểu diễn ảnh đầu vào qua miền tần số sử dụng biến đổi Fourier thuận, chọn hàm truyền đạt sao cho đạt kết quả mong muốn. Sau đó ta dùng biến đổi Fourier ngược để biểu diễn lại ảnh qua miền không gian.

h(m,n)

Bộ lọc

x(m,n)

y(m,n)

Mô hình lọc số miền tần số

Ta có:

Sử dụng biến đổi Fourier thuận, biểu diễn qua miền tần số ta được:

Ta có các bộ lọc miền tần số hay dùng là lọc thông thấp và thông cao

Bộ lọc thông thấp, bộ lọc thông cao

(i). Lọc thông thấp

– Mục đích: làm trơn ảnh

– Bộ lọc thông thấp lý tưởng: Hàm truyền đạt có dạng

, D(u,v) là khoảng cách từ điểm (u,v) đến gốc tọa độ tần số

còn được gọi là tần số cắt của bộ lọc. Là giao điểm giữa H(u,v) =1 với H(u,v)=0

– Gốc tọa độ

Bộ lọc lý tưởng chỉ ra rằng, tất cả các tần số trong vòng tròn bán kính D0 không bị suy giảm, trong khi đó tất cả các tần số ngoài vòng tròn này hoàn toàn bị suy giảm.

Đồ thị không gian của bộ lọc thông thấp lý tưởng, biểu diễn dưới dạng ảnh, lát cắt của đồ thị

– Bộ lọc ButterWorth thông thấp: Hàm truyền đạt bậc n với quĩ tích tần số cắt tại D0

Đồ thị không gian của bộ lọc thông thấp lý tưởng, biểu diễn dưới dạng ảnh, lát cắt của đồ thị

(ii) Lọc thông cao

Mục đích: Làm sắc nét ảnh

Bộ lọc thông cao có thể được định nghĩa qua bộ lọc thông thấp như sau

-Bộ lọc thông cao lý tưởng:

-Bộ lọc ButterWorth thông cao:

II. Khôi phục ảnh (Image Restoration)

Khôi phục ảnh để cập tới các kỹ thuật laọi bỏ hay tối thiểu hóa các ảnh hưởng cua môi trường bên ngoài hay các hệ thông thu nhận, phát hiện và lưu trữ ảnh đến ảnh thu nhận được.

Khôi phục ảnh bao gồm các quá trình như: lọc ảnh, khử nhiễu nhằm làm giảm các biến dạng để có thể khôi phục lại ảnh gần giống ảnh gốc tùy theo các nguyên nhân đã gây ra biến dạng.

– Về nguyên tắc: Khôi phục ảnh là nhằm xác định mô hình toán học của quá trình gây ra biến dạng, tiếp theo là dùng ánh xạ ngược để xác định lại ảnh.

Quá trình thu nhận ảnh từ thế giới thực

– Hướng tiếp cận: Một mô hình sẽ được xây dựng từ các ảnh kiểm nghiệm để xác định đáp ứng xung của hệ thống nhiễu.

II.1. Mô hình quan sát và tạo ảnh

– Cơ sở lý thuyết của kỹ thuật khôi phục ảnh: Quá trình gây ra biến dạng ảnh gốc phụ thuộc vào hệ thống quan sát và tạo ảnh. Ta phải xem xét ảnh quan sát được biểu diễn thế nào trên cơ sở đó mô hình hóa nhiễu sinh ra. Tiếp theo là dùng biến đổi ngược (lọc ngược) để khử nhiễu và thu lấy ảnh gốc.

– Ảnh quan sát được gồm: ảnh gốc + nhiễu: ,

– Nhiễu gồm:

+ Nhiễu nhân: thành phần nhiễu phụ thuộc kiểu thiết bị quan sát và tạo ảnh

+ Nhiễu cộng : thành phần nhiễu ngẫu nhiên độc lập

ü Như vậy là: nếu bằng cách nào đó xác định được các loại tác động biến dạng (phụ thuộc vào hệ thống và thiết bị) thì ta suy ra được ảnh gốc.

Hàm tác động gây nên biến dạng

h(m,n)

 

Bộ lọc

khôi phục ảnh

v(m,n)

u(m,n)

w(m,n)

h(m,n)

h(m,n): còn được gọi là hàm phân tán điểm (point-spread function

.)

Trong trường hợp lý tưởng,

II.2. Kỹ thuật lọc tuyến tính

(i). Lọc ngược

Lọc ngược là kỹ thuật khôi phục đầu vào của hệ thống khi biết đầu ra (ảnh thu nhận được).

h(m,n)

Tiến trình thu nhận ảnh

– Biểu diễn qua miền tần số:

Tiến trình phục hồi ảnh bằng lọc ngược

ü Để đơn giản ta gải thiết là hệ thống không có nhiễu. Như vậy thì vấn đề chỉ còn xác định xác định hàm phân tán điểm h(m,n).

Mô hình ảnh rung động mờ (Blur Motion)

+ Lý tưởng: ảnh không có rung động mờ:

+ Ảnh có rung động mờ tuyến tính (dịch chuyển, xoay, kết hợp cả 2,…):

L: độ dịch chuyển, j góc xoay

+ Rung động đồng nhất ngoài tiêu điểm (Uniform Out of Focus Blur)

Biến dạng ảnh do nhiễu loạn của khí quyển

k là hệ số hiệu chỉnh, k<1

Theo webng.com

Advertisements

9 comments on “Xử lý và nâng cao chất lượng ảnh

  1. Mình thấy những kiến thức tại đây khá hay và bổ ích. Mình học hỏi được nhiều tại đây. nhưng nhiều bài viết được trình bày trên chưa cẩn thận. các công thức, hình ảnh bị chèn, cắt sẻ bởi nội dung khác…, addmin xem lại dùm. Thanks

    • Bài viết này được copy lại từ định dạng khác nên bố cục chưa rõ ràng. Khi nào có thời gian tôi sẽ chỉnh sửa lại những bài viết này. Xin cảm ơn

  2. Anh có thể gửi cho em bộ tài liệu này được không. Em đang tìm hiểu về xử lý ảnh (nhận dạng biển số xe qua ảnh camera). Mong anh giúp đỡ. Xin cảm ơn.
    mail vuduytran89@gmail.com

    • Mình nghiên cứu vấn đề này cũng từ lâu rồi bạn à. Bây giờ mình ko còn tài liệu này nữa. Nhưng mình cũng có một số tài liệu khá hay bằng tiếng anh. Nếu bạn thích mình sẽ gửi cho bạn

  3. Chào anh! Bài viết của anh rất hữu ích. Không biết em xem đã kỹ chưa, nhưng hình như em không thấy lý thuyết của phần lọc sai số bình phương trung bình tối thiểu (Wiener Filtering). Em có phần lý thuyết (bằng tiếng anh) cho phần này nhưng khó hiểu quá. Em đang cần tài liệu làm demo cho phép lọc này mà chẳng biết làm thế nào. Có tài liệu gì mong anh giúp đỡ. Tks a. Mail em là: tholny@gmail.com

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s