Nếu các bạn hoạt động, làm việc trong lĩnh vực thương mại điện tử (E-commerce) hay digital marketing chắc biết đến Data management platform (DMP) còn được gọi là nền tảng quản lý dữ liệu tập trung. Thông qua DMP, các công ty có thể thu thập dữ liệu khách hàng, người dùng từ nhiều nguồn khác nhau  và tập trung vào một chỗ, mục đích để quản lý, lưu trữ, tiến hàng phân tích, kết quả thu được sẽ hỗ trợ hiệu quả các chiến dịch tiếp thị truyền thông kỹ thuật số, quảng cáo, chiến dịch bán hàng,…ví dụ điển hình như xây dựng hệ thống khuyến nghị (giới thiệu sản phẩm đúng với nhu cầu, sự quan tâm của khách hàng).

Các công dụng chính của DMP gần tương đương với những bước trong một quá trình lớn hơn là Data management – quản trị tài liệu. BigDataUni trình làng DMP ở đầu bài viết để bắt cầu nói về Data management, một thuật ngữ rộng hơn, khoanh vùng phạm vi bao quát hơn, vận dụng cho mọi loại tài liệu, mọi ngành và nghành nghề dịch vụ. Khối lượng tài liệu mà mỗi tổ chức triển khai phải tích lũy ngày này là rất lớn, không riêng gì riêng tài liệu người mua, do đó sẽ Open nhiều yếu tố, và thử thách phải đương đầu .
Data management theo những chuyên viên mặc dầu đã Open từ lâu nhưng trong những năm lại dành được nhiều sự chăm sóc khi nhu yếu khai thác tài liệu hiệu suất cao ngày càng cao. Data management đóng vai trò quyết định hành động cho sự thành bại của bất kể dự án Bất Động Sản Big data, Data mining, Data analytics hoặc thậm chí còn là AI, Machine Learning, nói chung là tương quan đến toàn bộ những hoạt động giải trí cần khai thác tài liệu .

BigDataUni sẽ gửi đến các bạn các bài viết với chủ đề về quản lý dữ liệu bắt đầu với Data management, tiếp theo là Data quality management, – một thành phần quan trọng của Data management hoặc có thể tách biệt với Data management nhưng dễ khiến chúng ta nhầm lẫn.


Phần 1 bài viết “ Tầm quan trọng của Data management ”, chúng tôi sẽ ra mắt đến những bạn khái niệm, định nghĩa đúng mực về quản trị tài liệu, những thành phần, và tiến trình chính có trong Data management. Khi thành tựu của công nghệ tiên tiến kỹ thuật của thời đại 4.0 ( là Big data, AI, Machine Learning ) đang trở thành xu thế toàn thế giới, thì tài liệu đã trở thành gia tài vô giá của mỗi công ty bên cạnh nhân lực và kinh tế tài chính .
Dữ liệu gồm nhiều loại và từ nhiều nguồn khác nhau ví dụ từ mạng lưới hệ thống thanh toán giao dịch, những “ điểm tiếp xúc ” với người mua, mạng lưới hệ thống sản xuất, máy quét, mạng lưới hệ thống cảm ứng, từ những website, kênh bán hàng trực tuyến, social truyền thông, những ứng dụng mưu trí kiến thiết xây dựng cho người mua, … Như đã nói, không riêng gì phong phú về loại và nguồn tích lũy, tài liệu thời nay còn mang lại thử thách về độ lớn khối lượng. Nhưng quan trọng hơn cả là tất cả chúng ta phải xác lập được “ Dữ liệu chứa đựng thông tin có ích gì ? ” “ Dữ liệu có giá trị nghiên cứu và phân tích không ? ”, “ Cái gì quyết định hành động giá trị của tài liệu ? ”, “ Làm cách nào để khám phá tri thức từ tài liệu ? ”, “ Dữ liệu tích lũy có tương quan đến tiềm năng kinh doanh thương mại ? ”, “ Tiếp cận, tích lũy, làm sạch, tích hợp, tàng trữ tài liệu như thế nào để thực thi nghiên cứu và phân tích ? ” .

Để trả lời cho các câu hỏi trên thì bước đầu tiên quan trọng nhất phải thực hiện đó chính là Data management.

Data managementlà gì?

Hiểu đơn thuần nhất : “ Data management best practices = better Data analytics ” nghĩa là nếu tất cả chúng ta quản trị tài liệu hiệu suất cao thì việc nghiên cứu và phân tích sẽ diễn ra tốt hơn, tác dụng đúng mực hơn. Data management hoàn toàn có thể được xem là những bước khởi đầu chuẩn bị sẵn sàng tài liệu để nghiên cứu và phân tích hay những bước giải quyết và xử lý tác dụng ( giải quyết và xử lý tài liệu ) sau quá trình nghiên cứu và phân tích. Nhiều công ty thường thất bại trong những dự án Bất Động Sản Big data, Data mining, hay Data analytics mà nguyên do xuất phát từ khâu quản trị tài liệu không hài hòa và hợp lý. Điển hình như tài liệu không trong trạng thái “ sẵn sàng chuẩn bị ”, chưa được hoàn hảo lại bị đem vào nghiên cứu và phân tích một cách vội vã, ví dụ tài liệu không được tinh lọc, không được làm sạch, không được quy đổi đúng cách ; tài liệu bị trùng lặp, định dạng tài liệu mới, không thích hợp với ứng dụng nghiên cứu và phân tích, ..

Data management là việc xây dựng, tổ chức, bảo trì, kiểm soát các hệ thống, quá trình (được tích hợp trong những mô hình kinh doanh hiện đại) xử lý dữ liệu như thu thập, lưu trữ, chọn lọc, làm sạch, chuyển đổi, phân tích,… hay kiểm soát các hoạt động có trong vòng đời dữ liệu (hoặc vòng đời thông tin) từ xác định mục tiêu kinh doanh đến trực quan hóa dữ liệu, áp dụng kết quả phân tích vào thực tế.

Nói cách khác, Data management là một tập hợp rất đầy đủ những việc làm thực tiễn, những tiến trình, những “ concept ” phối hợp với một loạt những mạng lưới hệ thống, công cụ được cho phép tổ chức triển khai “ giành quyền trấn áp ” và quản trị nguồn tài nguyên tài liệu của mình. Data management Open trong mỗi tiến trình của vòng đời tài liệu ví dụ xem xét trong một tập tài liệu, Data management ảnh hưởng tác động từ điểm mở màn của việc tích lũy, hình thành tập dữ liệu cho đến điểm kết thúc tàng trữ hay vô hiệu tập dữ liệu sau khi đã nghiên cứu và phân tích .
Theo The Global Data Management Community, còn được gọi là DAMA, trích dẫn trong The Data Management Body of Knowledge ( DMBOK ) – tài liệu hướng dẫn về Data management thì định nghĩa Data management như sau : “ The development, execution, and supervision of plans, policies, programs, and practices that deliver, control, protect, and enhance the value of data and information assets throughout their lifecycles. ” ( phiên bản 1 của tài liệu không có “ throughout their lifecycles ”, định nghĩa trên của phiên bản 2 ) .
Nghĩa là, Data management là việc tăng trưởng, tiến hành, giám soát những kế hoạch, chủ trương, chương trình hoạt động giải trí, và những việc làm thực tiễn nhằm mục đích cung ứng ( phân phối ), trấn áp, bảo vệ, ngày càng tăng giá trị của gia tài tài liệu và thông tin xuyên suốt vòng đời của chúng .
Yêu cầu về quản trị tài liệu hiệu suất cao đã trở nên cấp bách và cấp thiết hơn đặc biệt quan trọng so với những tổ chức triển khai lớn khi họ phải tuân thủ những quy tắc, luật lệ về bảo mật thông tin tài liệu người dùng, bảo mật thông tin thông tin cá thể, … ví dụ như điều luật GDPR ( General Data Protection Regulation ) bộ luật bảo vệ tài liệu chung được phát hành và vận dụng tại những nước trong liên minh châu Âu ( EU ) từ tháng 5/2018, và Luật An ninh mạng chính thức có hiệu lực thực thi hiện hành tại nước ta trong năm 2019 .
Ngoài ra, ngày này nhiều công ty sản xuất, dịch vụ quy mô từ nhỏ đến lớn tiến hành những hoạt động giải trí kinh doanh thương mại trực tuyến trải qua Internet, ví dụ sử dụng những kênh khác nhau để bán hàng như website, social truyền thông, … vận dụng những hình thức thanh toán giao dịch, giao dịch thanh toán trực tuyến, tương hỗ tư vấn người mua qua những ứng dụng, nền tảng gửi tin nhắn như Zalo, Facebook Messenger, tiến hành những chiến dịch tiếp thị kỹ thuật số ( digital marketing ) trên Facebook, Google, … Mỗi hoạt động giải trí đều phân phối một khối lượng tài liệu phong phú và có ích cần được quản trị hiệu suất cao để phục vụ việc nghiên cứu và phân tích .

Một chút về lịch sử Data management

Mặc dù Data management là công cụ quan trọng và phổ cập lúc bấy giờ nhưng đã Open từ rất lâu. Theo TechTarget, và Dataversity, thuật ngữ Data management đã Open từ những năm 1960 khi tổ chức triển khai ADAPSO ( the Association of Data Processing Service Organizations ) – hiệp hôi những tổ chức triển khai phân phối dịch vụ xử lý dữ liệu – đưa ra dịch vụ tư vấn, chương trình tập huấn, huấn luyện và đào tạo quản trị chất lượng, quản trị tài liệu. Vấn đề về quản trị tài liệu đã được chăm sóc đặc biệt quan trọng từ những năm 1950 do mạng lưới hệ thống máy tính lúc đó rất chậm, cồng kềnh, tính năng còn kém không hề tàng trữ, giải quyết và xử lý tài liệu, hơn thế nữa cần sử dụng một lực lượng nhân công lớn để quản lý và vận hành .
Mặt khác những công ty lại dành mọi khoảng trống để chứa tổng thể thẻ bấm lỗ gọi là “ punch cards ” để tàng trữ thông tin, tài liệu kỹ thuật số. Chính vì thế, những giải pháp tương hỗ quản trị tài liệu trong tiến trình này là vô cùng thiết yếu. Đây cũng hoàn toàn có thể được xem là điểm khởi đầu lưu lại sự sinh ra và tăng trưởng sau này của Data management .

Hình ảnh ví dụ về Punch card
Tiếp theo BigDataUni sẽ trình làng đến những bạn phần quan trọng tiếp theo chính là những quá trình, hay cũng hoàn toàn có thể gọi là những thành phần / tính năng có trong Data management .
Thật ra có rất nhiều cách phân loại, lựa chọn những việc làm, và thành phần có trong Data management, tùy vào quy mô, năng lực, nguồn lực, tiềm năng trong kinh doanh thương mại, đặc thù nguồn tài liệu, .. mà những tổ chức triển khai hoàn toàn có thể quyết định hành động thiết kế xây dựng một mạng lưới hệ thống Data management hoàn hảo, không thiếu hay chỉ gồm có những tính năng chính mà thôi .
Mặc dù vậy theo SAS – công ty đi đầu về nghành nghiên cứu và phân tích tài liệu trụ sở tại Hoa Kỳ, và những Trụ sở trên toàn thế giới, cung ứng dịch vụ tư vấn về tài liệu, ứng dụng nghiên cứu và phân tích tài liệu hạng sang – cho rằng một mạng lưới hệ thống Data management cần phải có đủ những tính năng, thành phần sau :

  • Data access

Dữ liệu mới trở thành gia tài của một tổ chức triển khai khi và chỉ khi tổ chức triển khai ấy hoàn toàn có thể lấy được tài liệu theo nhu yếu, tiềm năng đề ra. Data access – tiếp cận tài liệu – tương quan đến năng lực tiếp cận, tích lũy thông tin từ, tài liệu từ bất kể nguồn nào. Dữ liệu mà mỗi tổ chức triển khai, công ty phải tích lũy hoàn toàn có thể đến từ nhiều nơi khác nhau như những bảng tính Excel, những tệp văn bản, từ những cơ sở tài liệu, từ những email, những ứng dụng kinh doanh thương mại, bán hàng mưu trí, từ những website, những trang mạng xã hội, và tài liệu truyền về từ những thiết bị I.o.T ( Internet of things – Internet vạn vật ). Do đó nếu không có một giải pháp hiệu suất cao trong Data access, thì quy trình tích lũy sẽ rất khó khăn vất vả ảnh hưởng tác động đến hàng loạt mạng lưới hệ thống Data management. Chưa xét đến việc một tổ chức triển khai đã kiến thiết xây dựng một kế hoạch đơn cử cho Data management, nhưng việc tiên phong cần chăm sóc sau khi đã xác lập những tiềm năng kinh doanh thương mại, đó chính là xác lập tài liệu, nguồn tài liệu hài hòa và hợp lý và phương pháp tiếp cận và tích lũy sao cho hiệu suất cao. Các công cụ, ứng dụng tiên tiến và phát triển được sử dụng, kế hoạch cụ thể được đề ra trong Data access sẽ tương hỗ tổ chức triển khai tích lũy, trích xuất tài liệu tốt hơn .

  • Data integration

Data integration hay còn gọi là tổng hợp, tích hợp tài liệu. Dữ liệu mà mỗi tổ chức triển khai, công ty phải tích lũy đến từ nhiều nguồn khác, không giống hệt, và có nhiều định dạng khác nhau. Sau khi thu thập dữ liệu từ những nguồn khác nhau thì thường thì mỗi công ty, tổ chức triển khai phải triển khai tích hợp tổng thể tài liệu khác nhau, đơn cử là phối hợp những tài liệu khác nhau vào chung một cấu trúc, format, đặc thù nhất định, … ( hoặc quy đổi tài liệu này về cùng với tài liệu kia để tổng hợp vào những tập dữ liệu thống nhất ). Nói cách khác, Data integration tiềm năng là tàng trữ tài liệu từ nhiều nguồn khác nhau trong một hệ cơ sở tài liệu, một nguồn tài liệu nhất định, dưới dạng những bảng tính, tệp tài liệu, .. để tương hỗ quản trị và nghiên cứu và phân tích trong tương lai. Mặc dù quy trình tích hợp hoàn toàn có thể gặp khó khăn vất vả, nhưng quyền lợi nó đem lại, không riêng gì quyết định hành động đến tính hiệu suất cao của mạng lưới hệ thống Data management, mà còn phân phối những thông tin có ích trong lúc tích hợp. Ví dụ công ty có một tập dữ liệu về thông tin cá thể người mua như số điện thoại cảm ứng, nghề nghiệp, tuổi, .. và một tập dữ liệu về số lần thanh toán giao dịch người mua, mẫu sản phẩm thanh toán giao dịch, mức thanh toán giao dịch, lần cuối thanh toán giao dịch, … Kết hợp 2 tập dữ liệu công ty hoàn toàn có thể xác lập được những phân khúc người mua “ mê hoặc ”, “ đâu là nhóm người mua tiềm năng nhất ”, “ đâu là loại sản phẩm được chăm sóc theo nhóm tuổi / thu nhập / … ? ”. Để giúp những công ty giảm bớt những thử thách Data integration, nhiều tập đoàn lớn công nghệ tiên tiến IBM, Microsoft hay những tổ chức triển khai đi đầu lĩnh vực ứng dụng nghiên cứu và phân tích, giải pháp tài liệu như Oracle, SAS đã cho ra đời nhiều công cụ tương hỗ Data integration tốt hơn .

  • Data quality

( nguồn hình isoqarindia.com )
Data quality tương quan đến những việc làm xem xét và bảo vệ tài liệu tích lũy là đúng mực, tương thích, hoàn toàn có thể được dùng cho những mục tiêu nghiên cứu và phân tích sau này. Theo SAS, cũng giống như quy chuẩn chất lượng ISO trong sản xuất, thì những công ty cần tiến hành trấn áp Data quality tại bất kỳ quy trình tiến độ có trong Data management. Điều chăm sóc ở đầu cuối khi tất cả chúng ta tiến hành bất kể dự án Bất Động Sản về tài liệu nào đó chính là giá trị của tài liệu, thông tin có ích tất cả chúng ta có sau khi nghiên cứu và phân tích tài liệu. Tất cả đều bị ảnh hưởng tác động bởi chất lượng tài liệu hay gọi là Data quality. Giả sử nếu không thực thi kiểm tra chất lượng tài liệu trong Data access, trong bước tiên phong là thu thập dữ liệu, thì những quy trình, tính năng còn lại trong Data management sẽ gặp thất bại, dẫn đến tác dụng nghiên cứu và phân tích sau cuối không còn giá trị. Tuy nhiên không chỉ phải thực thi thực thi Data quality tại Data access mà còn song song ở toàn bộ những công dụng khác, xuyên suốt hàng loạt mạng lưới hệ thống Data management từ điểm mở màn thu thập dữ liệu, tích hợp tài liệu đến điểm kết thúc là trước khi bàn luận về hiệu quả nghiên cứu và phân tích ( trước khi xuất những báo cáo giải trình trực quan hóa, những đồ thị, bảng biểu cần kiểm tra lại tài liệu và tác dụng ) .

  • Data governance

Data governance – quản trị tài liệu – là tính năng cốt lõi của mạng lưới hệ thống Data management. Nhiều người thường nhầm lẫn giữa Data governance và Data management, nhưng thực ra không phải, như những bạn thấy trong bài viết này, ở đây Data governance là một phần, một tính năng của Data management mà thôi. Ở bài viết sắp tới BigDataUni sẽ trình làng về Data governance nhiều hơn, vì Data governance cũng đóng vai trò quan trọng trong việc tương hỗ khai thác tài liệu hiệu suất cao. Data governance là một bộ những quy tắc, chủ trương, quy trình tiến độ, kế hoạch, gồm có những quyết định hành động về nhân lực và công nghệ tiên tiến vận dụng. Data governance là “ mục tiêu ”, định hình phương pháp mỗi công ty quản trị, bảo vệ tài liệu của họ như thế nào, bảo vệ những tiềm năng khai thác, quản trị tài liệu luôn song song với những tiềm năng kinh doanh thương mại. Nói cách khác, Data governance là việc lập kế hoạch, thực thi, giám sát tổng thể những hoạt động giải trí quản trị tài liệu, tức là toàn bộ những tiến trình, công dụng có trong Data management được kể ở trên và sắp tới đây được trấn áp, xu thế và điều kiển bởi Data governance. Đây chính là nguyên do khiến nhiều người nhầm lẫn giữa 2 khái niệm. Nếu Data management là tập hợp những tính năng, quá trình mà một công ty tiến hành để quản trị tài liệu, thì Data governance lại có vai trò link và quản trị tổng thể những tính năng, quy trình tiến độ ấy .

  • Data federation

Data federation nếu dịch chính xác theo tiếng Việt có nghĩa là “liên đoàn dữ liệu”, nghe có vẻ không “hợp tai” nhưng có nghĩa bao quát là công cụ liên kết dữ liệu. Data federation là loại hình đặc biệt khác của Data integration. Data integration hỗ trợ chuyển đổi, tích hợp tất cả các dữ liệu khác nhau vào một nơi lưu trữ thống nhất có yêu cầu về cùng tính chất, đặc điểm, điều kiện nào đó,… tức là có việc di chuyển và lưu trữ dữ liệu để dùng cho việc phân tích sau này. Trong quá khứ, các công ty lưu trữ trong các kho dữ liệu gọi là Data warehouse, còn hiện nay có xu hướng lưu trữ trong Data lake (hồ dữ liệu). Sự khác biệt giữa Data lake và Data warehouse: Data warehouse biến đổi, lưu trữ dữ liệu từ các nguồn khác nhau, và những dữ liệu này có cấu trúc rõ ràng, Data lake lưu trữ dữ liệu chưa qua phân tích hay còn gọi là dữ liệu thô.

Data federation là một dạng tích hợp ảo tức là các chuyên gia có thể thông qua đó có thể nhìn vào và thấy được  các dữ liệu kết hợp khi nào cần mà không cần phải di chuyển và lưu trữ chúng vào một nơi. Các phần mềm Data federation tạo ra các virtual database (cơ sở dữ liệu ảo) cho phép chúng ta tham chiếu dữ liệu, xử lý trực tiếp dữ liệu, thực hiện các phân tích kinh doanh thông minh (Business Intelligence) hay các phân tích thông thường mà không cần phải sao chép, luân chuyển, lưu trữ qua đó tăng mức độ bảo mật, an toàn thông tin, đặc biệt có chức năng như cung cấp quyền truy cập, mã hóa dữ liệu,…

  • Master data management

Quản lý tài liệu chủ hay còn gọi là Master data management. Master data, tài liệu chủ, theo định nghĩa của Gartner, một công ty đi đầu trong nghành nghề dịch vụ điều tra và nghiên cứu và tư vấn giải pháp, là một tập hợp những định danh ( identifiers ) và thuộc tính thống nhất diễn đạt những thành phần cốt lõi của tổ chức triển khai, công ty như người mua, loại sản phẩm, gia tài, nhân viên cấp dưới, nhà sản xuất, những cấp Trụ sở, bộ phận công dụng, những website, … Ví dụ mã số người mua, số điện thoại thông minh, địa chỉ người mua phân phối thông tin diễn đạt về người mua được coi là master data. Master data management là một tập hợp những tiến trình, những công nghệ tiên tiến, chiêu thức tương hỗ quản trị tài liệu chủ để việc san sẻ tài liệu, luân chuyển tài liệu giữa toàn bộ những bộ phận, thành phần bên trong tổ chức triển khai diễn ra hiệu suất cao hơn. Lợi ích của quản trị tài liệu chủ và tầm quan trọng của nó, BigDataUni sẽ bàn luận cụ thể hơn ở những bài viết sắp tới .

  • Data preparation

Chuẩn bị dữ liệu cho các mục đích phân tích, mục đích sử dụng khác nau này cũng là chức năng quan trọng trong Data management. Data preparation nhiệm vụ tổng hợp, tích hợp dữ liệu từ nhiều nguồn khác nhau (có thể cho rằng bao gồm cả Data integration), chọn lọc, chuyển đổi, dữ liệu trước khi được phân tích và sử dụng trong các quy trình kinh doanh.  Data preparation còn được gọi là quá trình chuẩn bị và đưa dữ liệu vào sử dụng sau khi đã thu thập, lưu trữ, quản lý.

Không có một công việc, kế hoạch nào diễn ra thành công nếu không có sự chuẩn bị từ trước, phân tích dữ liệu cũng vậy, trước khi phân tích mỗi công ty phải tiến hành các bước chuẩn bị dữ liệu một cách hoàn chỉnh. Dữ liệu thu thập thường rất lớn, trong đó lại chứa nhiều dữ liệu không liên quan, dữ liệu bị hỏng, dữ liệu không đầy đủ, dữ liệu không chứa thông tin, giá trị (missing value hay null value),.. cần được xử lý trước. Theo các chuyên gia IBM, thời gian thực hiện quá trình chuẩn bị dữ liệu là nhiều nhất, chiếm gần 90% tổng thời gian dành cho mỗi dự án phân tích dữ liệu. Qua đó cho thấy tầm quan trọng của Data preparation, vì nó quyết định kết quả phân tích sau cùng có chính xác hay không, kết luận sau cùng dữ liệu có đem lại các giá trị, thông tin hữu ích hay không?

Bên trên là các chức năng, thành phần, những quá trình mà công ty SAS cho rằng là không thể thiếu của một hệ thống Data management. Dưới đây là một tập hợp các chức năng, quy trình đầy đủ nhất của Data management theo DAMA (Theo The Global Data Management Community), trích dẫn trong The Data Management Body of Knowledge (DMBOK,  phiên bản 2, năm 2017)

  • Data governance

Tương tự đã nói ở trên, Data governance là lập kế hoạch, tiến hành, giám sát hàng loạt hoạt động giải trí, những quy trình tiến độ, công dụng có trong quản lý tài sản tài liệu, trấn áp mạng lưới hệ thống Data management. DAMA đặt Data governance vào TT của vòng tròn Data management ( DAMA Wheel ), vì Data governance đóng vai trò là “ trái tim ”, thành phần cốt lõi, không thay đổi, cân đối toàn bộ những tính năng trong Data management .
The DAMA Wheel ( DMBOK phiên bản 2 )

  • Data architecture management

Liên quan đến những việc làm : xác lập nhu yếu, triển khai phong cách thiết kế, duy trì và tăng trưởng mạng lưới hệ thống kiến trúc tài liệu gồm có những quy mô, chủ trương, quy tắc hoặc tiêu chuẩn tác động ảnh hưởng đến phương pháp tài liệu được tích lũy, tàng trữ, sắp xếp, tích hợp, và đưa vào nghiên cứu và phân tích, sử dụng .

  • Data modelling and design

Thiết kế và quy mô hóa dữ liệu là quy trình tò mò, điều tra và nghiên cứu, nghiên cứu và phân tích tài liệu, xác lập, khám phá những nhu yếu, mục tiêu khai thác tài liệu, bộc lộ những nhu yếu, mục tiêu ấy vào những quy mô tài liệu thống nhất, chuẩn tắc, hoàn toàn có thể được sử dụng nhiều lần, lặp đi lặp lại trong tương lại. Data modelling đại diện thay mặt cho đối tượng người dùng tài liệu, bộc lộ mối liên hệ, sự phối hợp giữa những đối tượng người dùng tài liệu khác nhau và những quy tắc hoàn toàn có thể có giữa chúng .

  • Data storage and operations

Lưu trữ và quản lý và vận hành tài liệu gồm có việc phong cách thiết kế, tiến hành, tương hỗ tàng trữ tài liệu, mục tiêu tối đa hóa giá trị trong suốt vòng đời của chúng, từ việc tiếp cận, tích lũy, tích hợp đến giải quyết và xử lý. Lưu trữ và quản lý và vận hành tài liệu gồm có hai hoạt động giải trí phụ. Thứ nhất, Database support, tập trung chuyên sâu vào những hoạt động giải trí tương quan đến vòng đời tài liệu, từ việc tiến hành thiết kế xây dựng thiên nhiên và môi trường cơ sở tài liệu bắt đầu, đến việc tích lũy, tàng trữ, hay vô hiệu tài liệu, bảo vệ cơ sở tài liệu được hoạt động giải trí tốt trải qua giám sát, và kiểm soát và điều chỉnh. Thứ hai, Database technology tư vấn, xác lập những nhu yếu, nhu yếu của mạng lưới hệ thống tàng trữ tài liệu, xem xét với năng lực, nguồn lực hiện tại của tổ chức triển khai, xác lập những ứng dụng kỹ thuật, cấu trúc kiến trúc sẽ vận dụng, sau đó triển khai thiết kế xây dựng, thiết lập và quản trị những ứng dụng, và xử lý những yếu tố phát sinh tương quan đến kỹ thuật trong tương lai .

  • Data security

Data security, bảo mật thông tin tài liệu, gồm có những việc làm lập kế hoạch, tăng trưởng và thực thi những chủ trương và quá trình bảo mật thông tin, cung ứng những phương pháp xác nhận, ủy quyền, truy vấn và trấn áp, thống kê, báo cáo giải trình về tài liệu và gia tài thông tin. Các chi tiết cụ thể đơn cử về quy trình tiến độ Data security ( ví dụ tài liệu cần được bảo vệ ) khác nhau giữa những công ty, những ngành, nghành và thậm chí còn giữa những nước ( do mỗi nước có những bộ luật riêng về bảo mật an ninh mạng, bảo đảm an toàn tài liệu, .. ) Tuy nhiên, tiềm năng của những hoạt động giải trí bảo mật thông tin tài liệu là như nhau : bảo vệ gia tài thông tin, tài liệu, tuân thủ những pháp luật về quyền riêng tư, bảo mật thông tin, những nhu yếu, thỏa thuận hợp tác khác trong kinh doanh thương mại .

  • Data integration and interoperability

Tích hợp tài liệu và năng lực tương tác diễn đạt những quy trình tương quan đến sự vận động và di chuyển và hợp nhất tài liệu bên trong và giữa những mạng lưới hệ thống tàng trữ, những ứng dụng và tổ chức triển khai. Định nghĩa của Data integration ở đây tương tự như với Data integration đã nói ở phía trên nên chúng tôi sẽ không đề cập lại. Còn Data interoperability chính là năng lực những mạng lưới hệ thống tương tác, “ tiếp xúc ”, trao đổi tài liệu, thông tin với nhau .

  • Document and content management

Document and content management ( quản lý tài liệu, nội dung ) tương quan đến trấn áp quy trình tích lũy, tàng trữ, truy vấn và sử dụng những tài liệu, thông tin ở bên ngoài cơ sở tài liệu. Mục đích là duy trì tính toàn vẹn và được cho phép người dùng truy vấn và sử dụng tài liệu và thông tin phi cấu trúc hoặc bán cấu trúc. Trong nhiều tổ chức triển khai, tài liệu phi cấu trúc có mối quan hệ trực tiếp với tài liệu có cấu trúc do đó cần thiết lập những kế hoạch hành vi đơn cử, tiến hành và giám sát. Ngoài ra, cũng như những loại tài liệu khác, tài liệu và nội dung phi cấu trúc cần được kiểm tra về chất lượng và bảo mật thông tin .

  • Reference and master data

Các phòng ban, bộ phận, những quy trình tiến độ, mạng lưới hệ thống trong một tổ chức triển khai đều nhu yếu chia sẽ tài liệu để sử dụng với nhiều mục tiêu khác nhau. Mặc dù quyền lợi mà san sẻ tài liệu đem lại là rất nhiều, nhưng vẫn tiềm ẩn rủi ro đáng tiếc và yếu tố khác nhau như tài liệu trao đổi hoàn toàn có thể bị trùng lặp, dư thừa ; chất lượng tài liệu hoàn toàn có thể bị tác động ảnh hưởng ; và những ngân sách tương quan khác hoàn toàn có thể ngày càng tăng. Đó là nguyên do vì sao những tổ chức triển khai cần quản trị reference data và master data hiệu suất cao. Chúng tôi đã trình làng về master data trong Master data management ở phần trước nên không nhắc lại ở đây. Còn Reference data, tài liệu tham chiếu, là những bảng mã, tài liệu diễn đạt, phân loại tài liệu khác bên trong tổ chức triển khai hoặc tương quan đến tài liệu, thông tin khác ngoài khoanh vùng phạm vi tổ chức triển khai .
Ví dụ, để phân loại tài liệu người mua tiềm và để thuận tiện sàng lọc, tham chiếu, tất cả chúng ta hoàn toàn có thể đặt mã là dòng chữ viết tắt như “ KHTN ” hoặc tiếng anh “ PC ” – potential customer ; để miêu tả đơn vị chức năng tiền tệ của những vương quốc tất cả chúng ta có “ VND ” – Nước Ta Đồng, “ USD ” – US Dollars, đây là ví dụ Reference data tương quan đến tài liệu bên ngoài khoanh vùng phạm vi tổ chức triển khai .

  • Data warehousing and Business Intelligence

Data warehousing and Business Intelligence tương quan đến việc lập kế hoạch, triển khai và trấn áp những quy trình tiến độ để phân phối tài liệu tương hỗ ra quyết định hành động và tương hỗ lập báo cáo giải trình, truy vấn và nghiên cứu và phân tích tài liệu. Data warehousing miêu tả những quy trình trích xuất, làm sạch, quy đổi, trấn áp, truyền tải tài liệu, … trong kho tài liệu. Business Intelligence ( BI ) là những tiến trình, phương pháp sử dụng tài liệu để tương hỗ những nhà quản trị trong những công ty đưa ra những quyết định hành động về kinh doanh thương mại hay còn gọi là Business decisions. BI được coi là thuật ngữ phổ cập để miêu tả những cách sử dụng tài liệu ship hàng cho việc dự báo thiên nhiên và môi trường kinh doanh thương mại trải qua những bước nghiên cứu và phân tích để chớp lấy, phát hiện những yếu tố kinh doanh thương mại trong tài liệu, triển khai đưa ra những hành vi, giải pháp đơn cử .

  • Metadata management

Quản lý metada tương quan đến lập kế hoạch, tiến hành và trấn áp những hoạt động giải trí truy vấn, sử dụng metadata. Ở bài viết trước về Data mining “ Quy trình và chiêu thức ”, BigDataUni đã ra mắt về metadata – siêu dữ liệu, xin nhắc lại ở đây .
Metadata là loại tài liệu dùng để miêu tả những tài liệu khác, như miêu tả đặc thù, loại biến tài liệu, thông tin mà tài liệu đó phân phối, … Cùng với reference data và master data, metadata tương hỗ những quy trình xử ly, tích hợp, bảo mật thông tin, trấn áp, san sẻ tài liệu diễn ra hiệu suất cao và đúng mực hơn. Ngoài ra metadata còn giúp chùng ta hiểu rõ hơn về tài liệu, nhìn nhận chất lượng tài liệu, quản trị những cơ sở tài liệu, những ứng dụng tốt hơn .

  • Data quality management

Việc lập kế hoạch, thực thi và trấn áp những hoạt động giải trí vận dụng những kỹ thuật quản trị chất lượng vào tài liệu, để bảo vệ nó tương thích để nghiên cứu và phân tích và phân phối nhu yếu của người dùng, khái niệm gần giống với Data quality đã nói ở trên

Đến đây là kết thúc phần 1 bài viết về “Tầm quan trọng của Data management”, ở phần 2 bài viết sắp tới BigDataUni sẽ đi vào trọng tâm nói về các lợi ích, cũng như thách thức Data management đem lại, đặc biệt là các giải pháp triển khai Data management hiệu quả.

LEAVE A REPLY

Please enter your comment!
Please enter your name here