GSA Site Scanning(獨立出版商)
探索對美國聯邦網站的健康狀況和合規性的全面見解,為了解聯邦網站的動態和標準提供一個窗口。 透過自動掃描,該服務產生有關網站政策合規性和最佳實踐的詳細數據,增強政府數位資產的可訪問性和管理。
此連接器適用於以下產品和區域:
| 服務 | Class | Regions |
|---|---|---|
| 副駕駛工作室 | 進階 | 除下列區域外的所有 Power Automate 區域 : - 美國政府 (GCC) - 美國政府(海灣合作委員會高中) - 由 21Vianet 營運的中國雲 - 美國國防部 (DoD) |
| 邏輯應用程式 | 標準 | 所有 Logic Apps 區域, 但下列區域除外: - Azure Government 區域 - Azure 中國區域 - 美國國防部 (DoD) |
| Power Apps | 進階 | 除下列區域外的所有 Power Apps 區域 : - 美國政府 (GCC) - 美國政府(海灣合作委員會高中) - 由 21Vianet 營運的中國雲 - 美國國防部 (DoD) |
| Power Automate(自動化服務) | 進階 | 除下列區域外的所有 Power Automate 區域 : - 美國政府 (GCC) - 美國政府(海灣合作委員會高中) - 由 21Vianet 營運的中國雲 - 美國國防部 (DoD) |
| 連絡人 | |
|---|---|
| 名稱 | 理查德·威爾遜 |
| URL | https://www.richardawilson.com/ |
| richard.a.wilson@microsoft.com |
| 連接器中繼資料 | |
|---|---|
| Publisher | 理查德·威爾遜 |
| 網站 | https://open.gsa.gov/api/site-scanning-api |
| 隱私策略 | https://www.gsa.gov/technology/government-it-initiatives/digital-strategy/terms-of-service-for-developer-resources |
| 類別 | 資訊科技營運 |
正在建立連線
連接器支援下列驗證類型:
| 預設值 | 建立連線的參數。 | 所有區域 | 不可共享 |
預設
適用:所有地區
建立連線的參數。
這不是可共用的連線。 如果 Power App 與其他使用者共用,系統會明確提示其他使用者建立新連線。
| 名稱 | 類型 | Description | 為必填項目 |
|---|---|---|---|
| GSA API 金鑰 | securestring | GSA API 金鑰可從 https://open.gsa.gov/api/site-scanning-api/ | 對 |
節流限制
| 名稱 | 呼叫 | 續約期間 |
|---|---|---|
| 每個連線的 API 呼叫 | 100 | 60 秒 |
動作
| 執行網站分析 |
根據目標 URL、最終 URL 和掃描狀態等各種參數對網站進行全面分析。 |
| 檢索網站資訊 |
擷取網站的詳細資訊,包括目標和最終 URL、擁有權、掃描狀態和分析偵測。 |
| 透過 URL 檢索網站資訊 |
根據指定的 URL 擷取網站的詳細資訊。 |
執行網站分析
根據目標 URL、最終 URL 和掃描狀態等各種參數對網站進行全面分析。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
目標 URL 網域
|
target_url_domain | string |
網域名稱加上目標 URL 網域的頂層網域 (TLD)。 此參數指定掃描器的起點,與重定向後掃描結束的最終 URL 網域形成鮮明對比。 |
|
|
最終到達網址網域
|
final_url_domain | string |
網域名稱加上最終到達網址網域的頂層網域 (TLD)。 最終 URL 網域是掃描器在遵循重新導向後結束的位置,與目標 URL 網域相反。 |
|
|
最終到達網址即時
|
final_url_live | boolean |
透過傳回 2xx 系列中的 HTTP 狀態碼,指出最終到達網址是否有效。 |
|
|
目標 URL 重新導向
|
target_url_redirects | boolean |
布林值,指出 Target URL 是否重新導向,當傳回 3xx HTTP 狀態碼時會發生這種情況。 請注意,掃描器已停用快取,因此不存在 304 HTTP 狀態碼。 |
|
|
目標網址代理商擁有者
|
target_url_agency_owner | string |
指定擁有或營運與目標URL相關聯網站的機構。 |
|
|
目標網址局擁有者
|
target_url_bureau_owner | string |
指定擁有或營運與目標URL相關聯的網站的機構。 |
|
|
掃描狀態
|
primary_scan_status | string |
擷取網站掃描的狀態,以及任何已知的失敗原因。 值 unknown_error 是為系統中尚未編碼的錯誤保留的。 |
|
|
在最終到達URL處檢測到DAP
|
dap_detected_final_url | boolean |
布林值,指出是否在「最終 URL」偵測到數位分析程式 (DAP)。 |
傳回
- 身體
- AnalysisDto
檢索網站資訊
擷取網站的詳細資訊,包括目標和最終 URL、擁有權、掃描狀態和分析偵測。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
目標 URL 網域
|
target_url_domain | string |
網域名稱加上目標 URL 網域的頂層網域 (TLD)。 目標 URL 是掃描器的開始位置,與最終 URL 形成鮮明對比,最終 URL 掃描器在重新導向後結束。 |
|
|
最終到達網址網域
|
final_url_domain | string |
網域名稱加上最終到達網址網域的頂層網域 (TLD)。 最終 URL 是掃描器在遵循重新導向後結束的位置,與目標 URL 相反。 |
|
|
最終到達網址即時
|
final_url_live | boolean |
指出最終到達網址是否為即時,並傳回 2xx 系列中的 HTTP 狀態碼。 |
|
|
目標 URL 重新導向
|
target_url_redirects | boolean |
如果 Target URL 重新導向,則會記錄 (如果傳回 3xx HTTP 狀態碼,則為 true)。 掃描器已停用快取,因此不存在 304 狀態碼。 |
|
|
目標網址代理商擁有者
|
target_url_agency_owner | string |
擁有或營運與目標URL相關聯的網站的代理商。 |
|
|
目標網址局擁有者
|
target_url_bureau_owner | string |
擁有或營運與目標 URL 相關聯的網站的機構。 |
|
|
掃描狀態
|
primary_scan_status | string |
擷取掃描狀態和任何已知的失敗原因。 unknown_error保留給未編碼的錯誤。 |
|
|
在最終到達URL處檢測到DAP
|
dap_detected_final_url | boolean |
指出是否在最終 URL 偵測到數位分析程式 (DAP)。 |
|
|
限制
|
limit | integer |
指定要在單一結果頁面中傳回的項目數目。 |
|
|
頁面
|
page | integer |
指定要擷取的結果頁碼。 |
傳回
透過 URL 檢索網站資訊
根據指定的 URL 擷取網站的詳細資訊。
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
網站 URL
|
url | True | string |
要擷取資訊的網站 URL。 這應該包括網域名稱和任何相關的路徑元件。 |
傳回
定義
AnalysisDto
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
分析項目總數
|
total | number |
分析的項目總數。 |
|
分析的機構總數
|
totalAgencies | number |
分析網站的機構總數。 |
|
最終到達網址基底網域總數
|
totalFinalUrlBaseDomains | number |
分析的唯一最終 URL 基底網域總數。 |
PaginatedWebsiteResponseDto
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
網站項目
|
items | array of WebsiteApiResultDto |
網站結果陣列。 |
|
首頁鏈接
|
links.first | string |
結果第一頁的連結。 |
|
最後一頁鏈接
|
links.last | string |
結果最後一頁的連結。 |
|
下一頁鏈接
|
links.next | string |
結果下一頁的連結。 在結果的最後一頁,這將是一個空字串。 |
|
上一頁連結
|
links.previous | string |
結果上一頁的連結。 在結果的第一頁上,這將是一個空字串。 |
|
當前頁面
|
meta.currentPage | number |
目前的頁碼。 |
|
項目數量
|
meta.itemCount | number |
PaginationResponseDto.items 陣列中的專案數目。 |
|
每頁項目數
|
meta.itemsPerPage | number |
每頁的項目數。 這應該與限制查詢參數相同。 |
|
項目總數
|
meta.totalItems | number |
符合查詢的項目總數。 |
|
總頁數
|
meta.totalPages | number |
總頁數,以 floor(totalItems / itemsPerPage) 計算。 |
WebsiteApiResultD設為
| 名稱 | 路徑 | 類型 | Description | ||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
|
規範鏈接
|
canonical_link | string |
指出存在標準連結標籤。 |
||||||||
|
Cloud.gov Pages 託管
|
cloud_dot_gov_pages | boolean |
表示最終到達網址是使用 Cloud.gov 頁面代管。 |
||||||||
|
內容管理系統 (CMS)
|
cms | string |
指出用來代管最終 URL 的內容管理系統。 |
||||||||
|
在最終到達URL處檢測到DAP
|
dap_detected_final_url | boolean |
布林值,代表最終 URL 上存在 Digital Analytics 程式。 |
||||||||
|
最終到達URL的DAP引數
|
dap_parameters_final_url | object |
在最終 URL 上具有 Digital Analytics 程式參數索引鍵和值的物件。 |
||||||||
|
DNS 主機名稱
|
dns_hostname | string |
底層系統的網域,通常建議使用雲端或 CDN 提供者。 |
||||||||
|
最終到達網址
|
final_url | string |
從目標 URL 重新導向之後的 URL。 |
||||||||
|
最終到達網址 MIME 類型
|
final_url_MIMEType | string |
從 Content-Type 標頭擷取的最終 URL 的 MIME 型別。 |
||||||||
|
最終到達網址網域
|
final_url_domain | string |
最終到達網址的網域名稱 + 頂層網域。 |
||||||||
|
最終到達網址即時
|
final_url_live | boolean |
布林值,代表最終 URL 是否傳回 2xx 系列 HTTP 狀態碼。 |
||||||||
|
最終到達網址:相同網域
|
final_url_same_domain | boolean |
布林值欄位,表示最終 URL 是否與目標 URL 位於同一網域中。 如果為 false,則表示重新導向。 |
||||||||
|
最終到達網址:相同網站
|
final_url_same_website | boolean |
指出最終到達網址的路徑或網域是否與目標網址不同。 |
||||||||
|
最終到達網址狀態碼
|
final_url_status_code | number |
最終 URL 的 HTTP 狀態碼。 |
||||||||
|
最終到達網址網站
|
final_url_website | string |
包括最終到達網址的子網域和頂層網域。 |
||||||||
|
最終到達網址的主要元素存在
|
main_element_present_final_url | boolean |
指出最終到達網址中是否 <存在主要> 元素。 |
||||||||
|
最終 URL 的 Open Graph 文章修改日期
|
og_article_modified_final_url | string |
Open Graph 文章已修改標籤 (如果最終 URL 上可用)。 |
||||||||
|
最終到達網址的開啟圖表文章發佈日期
|
og_article_published_final_url | string |
Open Graph 文章已發佈標籤 (如果最終到達網址上有的話)。 |
||||||||
|
在最終到達網址開啟圖表說明
|
og_description_final_url | string |
Open Graph 描述標籤(如果在最終 URL 上找到)。 |
||||||||
|
在最終到達網址開啟圖表標題
|
og_title_final_url | string |
Open Graph 標題標籤 (如果在最終 URL 上找到)。 |
||||||||
|
Robots.txt 爬蟲延遲
|
robots_txt_crawl_delay | integer |
編目延遲值(以秒為單位)(如果存在於 robots.txt 檔案中)。 |
||||||||
|
偵測到 Robots.txt
|
robots_txt_detected | boolean |
指出是否偵測到 robots.txt 檔案。 |
||||||||
|
Robots.txt 最終到達網址
|
robots_txt_final_url | string |
任何重新導向後 robots.txt 檔案的最終 URL。 |
||||||||
|
Robots.txt 最終到達網址 MIME 類型
|
robots_txt_final_url_MIMETYPE | string |
從 Content-Type 標頭擷取的 robots.txt 頁面的 MIME 型別。 |
||||||||
|
Robots.txt 最終到達網址即時
|
robots_txt_final_url_live | boolean |
指出最終到達網址 HTTP 狀態 robots.txt 是否屬於 2xx 系列。 |
||||||||
|
Robots.txt 最終 URL 大小 (以位元組為單位)
|
robots_txt_final_url_size_in_bytes | number |
robots.txt 檔案的檔案大小 (以位元組為單位)。 |
||||||||
|
Robots.txt 最終到達網址狀態碼
|
robots_txt_final_url_status_code | number |
robots.txt 最終到達網址的 HTTP 狀態碼。 |
||||||||
|
Robots.txt 目標 URL 重新導向
|
robots_txt_target_url_redirects | boolean |
指出目標 robots.txt URL 是否重新導向。 這會特別針對 robots.txt 檔案。 |
||||||||
|
掃描日期
|
scan_date | string |
執行掃描的日期時間。 |
||||||||
|
掃描狀態
|
primary_scan_status | string |
核心掃描的成功狀態。 |
||||||||
|
Sitemap.xml URL 計數
|
sitemap_xml_count | integer |
指出在 sitemap.xml 檔案中找到的 url> 元素數目<。 |
||||||||
|
偵測到 Sitemap.xml
|
sitemap_xml_detected | boolean |
指出是否找到 sitemap.xml 檔案。 |
||||||||
|
Sitemap.xml 最終到達網址
|
sitemap_xml_final_url | string |
任何重新導向後 sitemap.xml 頁面的最終 URL。 |
||||||||
|
Sitemap.xml 最終到達網址 MIME 類型
|
sitemap_xml_final_url_MIMETYPE | string |
從 Content-Type 標頭擷取的 sitemap.xml 最終 URL 的 MIME 型別。 |
||||||||
|
Sitemap.xml 最終到達網址檔案大小
|
sitemap_xml_final_url_filesize | integer |
sitemap.xml 頁面的檔案大小 (以位元組為單位)。 |
||||||||
|
Sitemap.xml 最終到達網址即時
|
sitemap_xml_final_url_live | boolean |
指出最終 sitemap.xml 網址狀態碼是否屬於 2xx 系列。 |
||||||||
|
Sitemap.xml 最終到達網址狀態碼
|
sitemap_xml_final_url_status_code | number |
sitemap.xml 頁面的 HTTP 狀態碼。 |
||||||||
|
Sitemap.xml PDF URL 計數
|
sitemap_xml_pdf_count | integer |
sitemap.xml中具有PDF副檔名的URL數目。 |
||||||||
|
Sitemap.xml 目標 URL 重新導向
|
sitemap_xml_target_url_redirects | boolean |
指出 sitemap.xml 頁面是否重新導向。 這會特別針對 sitemap.xml 檔案。 |
||||||||
|
資料來源:DAP List
|
source_list_dap | boolean |
指出 Digital Analytics 程式是否為「目標 URL 清單」提供此 URL。 |
||||||||
|
來源於聯邦網域列表
|
source_list_federal_domains | boolean |
指出「聯邦網域清單」是否為「目標 URL 清單」提供此 URL。 |
||||||||
|
來源於其他列表
|
source_list_other | boolean |
指出手動維護的其他網站清單是否為目標URL清單提供此URL。 |
||||||||
|
來源於 Pulse CIO 名單
|
source_list_pulse | boolean |
指出 pulse.cio.gov 快照是否為目標 URL 清單提供此 URL。 |
||||||||
|
目標網址
|
target_url | string |
掃描器開始掃描時使用的 URL。 |
||||||||
|
目標URL 404測試
|
target_url_404_test | boolean |
測試目標 URL 是否透過呼叫 UUID 型路徑名稱來正確處理 404。 |
||||||||
|
目標網址代理商擁有者
|
target_url_agency_owner | string |
擁有目標網址的代理商。 |
||||||||
|
目標網址:政府分支機構
|
target_url_branch | string |
與 URL 相關聯的政府部門。 |
||||||||
|
目標網址局擁有者
|
target_url_bureau_owner | string |
擁有目標 URL 的局。 |
||||||||
|
目標 URL 網域
|
target_url_domain | string |
目標URL的基底網域(網域名稱+頂層網域)。 |
||||||||
|
目標 URL 重新導向
|
target_url_redirects | boolean |
指出目標 URL 是否重新導向。 |
||||||||
|
第三方服務計數
|
third_party_service_count | number |
找到的第三方服務數目。 |
||||||||
|
第三方服務網域
|
third_party_service_domains | array of string |
從最終 URL 進行輸出呼叫的第三方服務清單。 第三方定義為與 URL 的主機名不匹配。 |
||||||||
|
USWDS 計數
|
uswds_count | number |
所有 USWDS 似然啟發式方法的總和。 |
||||||||
|
USWDS 網站圖標
|
uswds_favicon | number |
HTML 源中存在 USWDS 美國國旗網站圖標。 存在為 USWDS 似然啟發式增加了 20 分。 |
||||||||
|
CSS 中的 USWDS 網站圖示
|
uswds_favicon_in_css | number |
CSS 來源中存在 USWDS 美國國旗網站圖示。 存在為 USWDS 似然啟發式增加了 20 分。 |
||||||||
|
USWDS 內嵌 CSS
|
uswds_inline_css | number |
內嵌 HTML 源中 .usa- CSS 類的出現次數。 |
||||||||
|
USWDS 公共無字體
|
uswds_publicsans_font | number |
CSS 源中存在 Public Sans 字體。 存在為 USWDS 似然啟發式增加了 20 分。 |
||||||||
|
USWDS 語意版本
|
uswds_semantic_version | string |
USWDS 的語意版本字串。 |
||||||||
|
USWDS 源無字體
|
uswds_source_sans_font | number |
CSS 源代碼中存在 Source Sans 字體。 存在為 USWDS 可能性啟發式增加了 5 分。 |
||||||||
|
USWDS 字串出現次數
|
uswds_string | number |
字串 uswds 在 HTML 來源中出現的次數。 |
||||||||
|
CSS 中的 USWDS 字串
|
uswds_string_in_css | number |
CSS 來源中 uswds 的出現次數。 |
||||||||
|
USWDS 表格
|
uswds_tables | number |
計算 (HTML 的數量 元素) * -10。
|