UdeStringUtils
一般常見的第三方函式庫,由於其中字串也是使用 JAVA 原生的 LENGTH/SUBSTRING 等 method 實作,所以碰到含有中文姓名、地址的文字內容,有時就會發生問題。 所以 UDE 包裝 JAVA 提供的替代實作為對應的API,供處理中文字串時使用。
註: 未提供 charAt 對應方法,因為回傳結果可能無法以CHAR表示。
Method | 說明 |
---|---|
fromCodePoint | 將UNICODE-Integer 陣列依所選之範圍轉換為字串 |
toCodePointArray | 將字串轉換成 UNICODE-Integer 陣列 |
indexOf | 從頭找出第一個出現搜尋字串的位置 |
lastIndexOf | 從後面找出第一個出現搜尋字串的位置 |
length | 字串長度 |
substring | 回傳子字串 |
toFullChar | 字串轉全型 |
toHelfChar | 字串轉半型 |
trim | 刪除所有字串前後定義的空白字元 (含換行) |
removeBOM | 刪除所有Unicode的(BOM字元) |
divideByChar | 將字串依字元長度等份切割 |
divideByUTF8Bytes | 將字串依UTF8編碼Byte長度等份切割 |
全型/半型轉換
一般全半型文字、符號的轉換。半型到全型為1對1,但反之則不然。全型符號可能沒有對應的半型符號;也可能有多種全型符號對應到同一個半型符號,如空白字元。 目前除了UNICODE中標準的轉換以外,對 3000-303F(中日韓符號和標點)定義以下對應:
全型 | 、 | 。 | 〃 | 〈 | 〉 | 《 | 》 | 【 | 】 | 〔 | 〕 | ~ | 〝 | 〞 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
半型 | , | . | 「 | < | > | < | > | { | } | [ | ] | ~ | 「 | 「 |
未來可能會另外提供自定轉碼表的功能。
trim
額外提供對於全形、換行、UNICODE特殊空白字元定義的消除功能。
removeBOM
使用部分WINDOWS軟體編輯UTF8文件時,可能會在開頭加上BOM字元(FEFF),此方法可消除文件中所有的BOM字元,避免因使用者在複製貼上過程中,多加入BOM字元而不自知造成的錯誤。通常可能會在處理 CSV 或其它可能被使用者以純文字編輯的資料檔案時用到。
divideByChar
對字串依固定字數進行分割。
divideByUTF8Bytes
依編碼為UTF8後的BYTE數做切割,並且避免把同一個字切成兩塊。通常對於資料交換、或要把資料存入資料庫前的檢查時,可能會有幫助。
未來考慮增加功能 可用於Javascript編碼的轉換.