การรวมข้อมูลเป็นการรวมแหล่งข้อมูลหลาย ๆ แหล่งไว้ในแหล่งข้อมูลเดียว การปฏิบัตินี้มักใช้เวลามากและเกี่ยวข้องเนื่องจากแหล่งข้อมูลที่แตกต่างกันอาจเข้ากันไม่ได้ สิ่งที่เรียบง่ายเหมือนชื่อคอลัมน์ที่แตกต่างกันในสเปรดชีตก็เพียงพอที่จะต้องทำการจัดรูปแบบวันที่ใหม่ กระบวนการนี้พบได้บ่อยที่สุดในสถานการณ์ที่ทั้งสองกลุ่มเริ่มต้นโดยไม่มีการเชื่อมต่อ แต่จะถูกรวมเข้าด้วยกันหลังจากที่พวกเขาทำงานอย่างอิสระ การรวมข้อมูลได้กลายเป็นหัวข้อที่สำคัญมากขึ้นเนื่องจากความชุกของแหล่งข้อมูลฟรีและฐานข้อมูลออนไลน์
ส่วนข้อมูลของการรวมข้อมูลสามารถเกือบทุกอย่างตราบใดที่มันถูกเก็บไว้ในระบบคอมพิวเตอร์ เนื้อหาที่แท้จริงของข้อมูลนั้นไม่ค่อยสำคัญเท่ากับวิธีการจัดเก็บข้อมูล ส่วนใหญ่แล้วข้อมูลจะถูกเก็บไว้ในฐานข้อมูลจัดระบบข้อมูล ระบบเหล่านี้มีรายการและฟิลด์ที่ไม่ซ้ำกันซึ่งช่วยให้ผู้ใช้สามารถค้นหาข้อมูลได้อย่างรวดเร็ว
อุปสรรค์ที่ใหญ่ที่สุดในกระบวนการรวมข้อมูลใด ๆ คือข้อมูลเอง ในหลายกรณีเมื่อมีการตั้งค่าข้อมูลเป็นครั้งแรกไม่มีความตั้งใจที่จะรวมชุดข้อมูลเข้ากับชุดข้อมูลอื่น ซึ่งหมายความว่าแม้ว่าชุดข้อมูลสองชุดอาจอ้างถึงสิ่งเดียวกัน แต่ก็ไม่เข้ากันโดยสิ้นเชิง
เกือบทุกอย่างจะทำให้ฐานข้อมูลไม่เข้ากัน สิ่งที่เรียบง่ายแตกต่างในงานนำเสนอเช่นคำสั่งฟิลด์หรือความกว้างของคอลัมน์อาจเพียงพอที่จะป้องกันการควบรวมกิจการที่ง่าย เมื่อข้อมูลมีความแตกต่างอย่างมีนัยสำคัญเช่นฐานข้อมูลเดียวที่มีข้อมูลมากกว่าหรือน้อยกว่าการผสานนั้นยากกว่ามาก
สองสถานการณ์ที่เรียกร้องให้มีการรวมข้อมูลมากกว่าในสถานการณ์ทางธุรกิจและการวิจัย ในโลกธุรกิจการรวมแผนกหรือ บริษัท ต่างๆนั้นจำเป็นต้องรวมข้อมูลที่แยกต่างหากก่อนหน้านี้ไว้ในโครงสร้างเดียว การรวมรูปแบบนี้โดยทั่วไปจะทำได้ยากมากเว้นแต่กลุ่มดั้งเดิมจะใช้ซอฟต์แวร์ที่คล้ายกันและมีเป้าหมายข้อมูลที่คล้ายคลึงกัน
เมื่อทำการรวมข้อมูลเพื่อการวิจัยโดยทั่วไปแล้วจะราบรื่นกว่ามาก เมื่อนักวิจัยคนหนึ่งให้การเข้าถึงข้อมูลของเขาไปยังอีกฝ่ายทั้งสองมักจะมองไปที่กระบวนการเดียวกัน ซึ่งหมายความว่าพวกเขาจะใช้วิธีการที่คล้ายกันในการทำแคตตาล็อกและจัดเก็บข้อมูล
ในอดีตการรวมข้อมูลเป็นส่วนหนึ่งของการศึกษาข้อมูล แต่มีการเปลี่ยนแปลงตั้งแต่ต้นศตวรรษที่ 21 ด้วยฐานข้อมูลออนไลน์ฟรีที่ได้รับความนิยมและถูกต้องมากขึ้น บริษัท ต่าง ๆ กำลังดิ้นรนเพื่อให้ได้ข้อมูลในรูปแบบที่สามารถแชร์ได้ สิ่งนี้ช่วยให้พวกเขาทั้งสองปล่อยข้อมูลของพวกเขาในรูปแบบสาธารณะและรวมรุ่นส่วนตัวของอินเตอร์เฟซสาธารณะที่รู้จักกันดีในระบบของพวกเขา


