全國咨詢/投訴熱線:400-618-4000

全部 大數據新聞動態 大數據技術文章 大數據常見問題 技術問答

    • 怎樣使用Linux和HDFS創建RDD?

      Spark可以從Hadoop支持的任何存儲源中加載數據去創建RDD,包括本地文件系統和HDFS等文件系統。我們通過Spark中的SparkContext對象調用textFile()方法加載數據創建RDD。這里以Linux本地系統和HDFS分布式文件系統為例,講解如何創建RDD。 查看全文>>

      大數據技術文章2020-12-07 |傳智教育 |創建RDD,RDD

    • 什么是Sqoop?Sqoop發展歷程簡介

      Sqoop是Apache旗下的一款開源工具,該項目開始于2009年,最早是作為Hadoop的一個第三方模塊存在,后來為了讓使用者能夠快速部署,也為了讓開發人員能夠更快速的迭代開發,并在2013年,獨立成為Apache的一個頂級開源項目。 查看全文>>

      大數據技術文章2020-12-07 |傳智教育 |Sqoop,什么是sqoop

    • 什么是數據倉庫?大數據的數據倉庫有哪些特點?

      數據倉庫是一個面向主題的、集成的、隨時間變化的,但信息本身相對穩定的數據集合,它用于支持企業或組織的決策分析處理,基于數據倉庫的定義,數據倉庫此處有四個特點: 查看全文>>

      大數據技術文章2020-12-02 |傳智教育 |數據倉庫特點,數據倉庫

    • hadoop虛擬機如何安裝和配置JDK?

      Hadoop是由Java語言開發的,Hadoop集群的使用依賴于Java環境,因此在安裝Hadoop集群前,需要先安裝并配置好JDK。接下來,就在前面規劃的Hadoop集群主節點hadoop01機器上分步驟演示,如何安裝和配置JDK,具體如下。 查看全文>>

      大數據技術文章2020-12-02 |傳智播客 |JDK的安裝和配置

    • Linux系統安裝虛擬機的網絡配置方法

      虛擬機在安裝和克隆之后,雖然能夠直接使用,但是此時虛擬機的IP是動態生成的,在不斷的開停過程中很容易改變,非常不利于實際開發;通過Hadoop01克隆的虛擬機(假設克隆了2個虛擬機Hadoop02和Hadoop03)則完全無法動態分配到IP,直接無法使用。因此,虛擬機在安裝和克隆之后還需要對虛擬機的網絡都分別進行配置。 查看全文>>

      大數據技術文章2020-12-02 |傳智教育 |虛擬機網絡配置,Linux系統網絡

    • HDFS讀寫流程介紹,HDFS讀數據和寫數據的原理是什么?

      Client(客戶端)對HDFS中的數據進行讀寫操作,分別是Client從HDFS中查找數據,即為Read(讀)數據;Client從HDFS中存儲數據,即為Write(寫)數據。假設有一個文件1.txt文件,大小為300M,這樣就劃分出3個數據塊,我們根據這三個模塊分別講解HDFS文件讀數據和寫數據的原理。 查看全文>>

      大數據技術文章2020-12-01 |傳智教育 |HDFS讀寫流程,HDFS讀寫數據的原理

    • MapReduce程序怎樣設置本地運行模式?

      MapReduce程序運行模式有本地運行模式和集群運行模式,集群運行模式只需要將MapReduce程序打成Jar包上傳至集群即可,下面我們以詞頻統計為例,講解如何將MapReduce程序設置為在本地運行模式。 查看全文>>

      大數據技術文章2020-12-01 |傳智教育 |MapReduce兩種運行模式

    • Scala算術操作符重載怎樣使用?

      ?Scala算術和操Scala中算術操作符(+、-、*、/、%)的作用和Java是一樣的,位操作符(&、|、>>、<<)也是一樣的。特別強調的是,Scala的這些操作符其實是方法。例如,a+b其實是a.+(b)的簡寫,接下來,我們通過Scala交互式Shell編程講解操作符的使用,具體示例代碼如下。 查看全文>>

      大數據技術文章2020-11-18 |傳智播客 |Scala算術和操符

    << < 1 2 3 4 5 6 7 8 9 ... 29 > >>
人妻系列无码专区_漂亮人妻被中出中文字幕_人妻中文制服巨乳中文