UdeStringUtils

一般常見的第三方函式庫,由於其中字串也是使用 JAVA 原生的 LENGTH/SUBSTRING 等 method 實作,所以碰到含有中文姓名、地址的文字內容,有時就會發生問題。 所以 UDE 包裝 JAVA 提供的替代實作為對應的API,供處理中文字串時使用。

註: 未提供 charAt 對應方法,因為回傳結果可能無法以CHAR表示。

Method 說明
fromCodePoint 將UNICODE-Integer 陣列依所選之範圍轉換為字串
toCodePointArray 將字串轉換成 UNICODE-Integer 陣列
indexOf 從頭找出第一個出現搜尋字串的位置
lastIndexOf 從後面找出第一個出現搜尋字串的位置
length 字串長度
substring 回傳子字串
toFullChar 字串轉全型
toHelfChar 字串轉半型
trim 刪除所有字串前後定義的空白字元 (含換行)
removeBOM 刪除所有Unicode的(BOM字元)
divideByChar 將字串依字元長度等份切割
divideByUTF8Bytes 將字串依UTF8編碼Byte長度等份切割

全型/半型轉換

一般全半型文字、符號的轉換。半型到全型為1對1,但反之則不然。全型符號可能沒有對應的半型符號;也可能有多種全型符號對應到同一個半型符號,如空白字元。 目前除了UNICODE中標準的轉換以外,對 3000-303F(中日韓符號和標點)定義以下對應:

全型
半型 , . < > < > { } [ ] ~

未來可能會另外提供自定轉碼表的功能。

trim

額外提供對於全形、換行、UNICODE特殊空白字元定義的消除功能。

removeBOM

使用部分WINDOWS軟體編輯UTF8文件時,可能會在開頭加上BOM字元(FEFF),此方法可消除文件中所有的BOM字元,避免因使用者在複製貼上過程中,多加入BOM字元而不自知造成的錯誤。通常可能會在處理 CSV 或其它可能被使用者以純文字編輯的資料檔案時用到。

divideByChar

對字串依固定字數進行分割。

divideByUTF8Bytes

依編碼為UTF8後的BYTE數做切割,並且避免把同一個字切成兩塊。通常對於資料交換、或要把資料存入資料庫前的檢查時,可能會有幫助。


未來考慮增加功能 可用於Javascript編碼的轉換.

results matching ""

    No results matching ""